<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Безопасность ИИ on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/%D0%B1%D0%B5%D0%B7%D0%BE%D0%BF%D0%B0%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C-%D0%B8%D0%B8/</link><description>Recent content in Безопасность ИИ on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Mon, 23 Feb 2026 09:00:00 +0300</lastBuildDate><atom:link href="/tags/%D0%B1%D0%B5%D0%B7%D0%BE%D0%BF%D0%B0%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C-%D0%B8%D0%B8/index.xml" rel="self" type="application/rss+xml"/><item><title>ChatGPT использовал расовое оскорбление в обычном разговоре</title><link>/news/chatgpt-ispolzoval-rasovoe-oskorblenie-v-razgovore/</link><pubDate>Mon, 23 Feb 2026 09:00:00 +0300</pubDate><guid>/news/chatgpt-ispolzoval-rasovoe-oskorblenie-v-razgovore/</guid><description>&lt;p&gt;Пользователь Reddit сообщил, что ChatGPT обратился к нему с расовым оскорблением (N-word в «мягкой» форме) во время обычного разговора — без какого-либо упоминания расы или провокации. Причиной оказалась функция Memory, которая запомнила просьбу «говорить неформально и использовать сленг», и интерпретировала её слишком буквально.&lt;/p&gt;
&lt;h2 id="что-произошло"&gt;Что произошло&lt;/h2&gt;
&lt;p&gt;Пользователь с бесплатной версией ChatGPT попросил помочь найти песню по обрывкам текста. В ответе модель употребила расовый сленг вместо обычного обращения вроде «bro» — без джейлбрейка, без промпт-инъекций, без контекста, связанного с расой.&lt;/p&gt;</description></item><item><title>Anthropic Institute: что это и зачем нужен</title><link>/articles/anthropic-institute-chto-eto-zachem/</link><pubDate>Thu, 30 Jan 2025 00:00:00 +0000</pubDate><guid>/articles/anthropic-institute-chto-eto-zachem/</guid><description>&lt;p&gt;Компания Anthropic — создатель семейства моделей Claude — сделала шаг, который выходит далеко за рамки разработки очередного чат-бота. В начале 2025 года она анонсировала создание &lt;strong&gt;Anthropic Institute&lt;/strong&gt; — отдельной исследовательской структуры, сфокусированной на изучении общественных, политических и этических аспектов развития искусственного интеллекта. Если раньше Anthropic ассоциировалась прежде всего с техническими исследованиями в области AI Safety, то теперь компания открыто претендует на роль интеллектуального центра, формирующего глобальную повестку вокруг безопасного ИИ.&lt;/p&gt;</description></item><item><title>Австралия и Anthropic подписали соглашение по безопасности ИИ</title><link>/articles/avstraliya-anthropic-soglashenie-bezopasnost-ii/</link><pubDate>Thu, 30 Jan 2025 00:00:00 +0000</pubDate><guid>/articles/avstraliya-anthropic-soglashenie-bezopasnost-ii/</guid><description>&lt;p&gt;Пока большинство дискуссий об ИИ крутится вокруг новых моделей и бизнес-применений, правительства по всему миру начинают делать нечто более системное — заключать официальные соглашения с ведущими AI-компаниями. Австралия стала очередной страной, подписавшей меморандум о взаимопонимании (MOU) с Anthropic — создателем Claude. Это не просто бюрократический документ: речь идёт о формировании нового формата отношений между государствами и разработчиками frontier-моделей.&lt;/p&gt;
&lt;p&gt;Разберём, что именно подписали стороны, зачем это нужно Австралии и Anthropic, и какой сигнал это посылает остальному миру.&lt;/p&gt;</description></item></channel></rss>