Безопасность ИИ on AI-Uchi — Всё об искусственном интеллекте

ChatGPT использовал расовое оскорбление в обычном разговоре

Mon, 23 Feb 2026 09:00:00 +0300

Пользователь Reddit сообщил, что ChatGPT обратился к нему с расовым оскорблением (N-word в «мягкой» форме) во время обычного разговора — без какого-либо упоминания расы или провокации. Причиной оказалась функция Memory, которая запомнила просьбу «говорить неформально и использовать сленг», и интерпретировала её слишком буквально.

Что произошло

Пользователь с бесплатной версией ChatGPT попросил помочь найти песню по обрывкам текста. В ответе модель употребила расовый сленг вместо обычного обращения вроде «bro» — без джейлбрейка, без промпт-инъекций, без контекста, связанного с расой.

Anthropic Institute: что это и зачем нужен

Thu, 30 Jan 2025 00:00:00 +0000

Компания Anthropic — создатель семейства моделей Claude — сделала шаг, который выходит далеко за рамки разработки очередного чат-бота. В начале 2025 года она анонсировала создание Anthropic Institute — отдельной исследовательской структуры, сфокусированной на изучении общественных, политических и этических аспектов развития искусственного интеллекта. Если раньше Anthropic ассоциировалась прежде всего с техническими исследованиями в области AI Safety, то теперь компания открыто претендует на роль интеллектуального центра, формирующего глобальную повестку вокруг безопасного ИИ.

Австралия и Anthropic подписали соглашение по безопасности ИИ

Thu, 30 Jan 2025 00:00:00 +0000

Пока большинство дискуссий об ИИ крутится вокруг новых моделей и бизнес-применений, правительства по всему миру начинают делать нечто более системное — заключать официальные соглашения с ведущими AI-компаниями. Австралия стала очередной страной, подписавшей меморандум о взаимопонимании (MOU) с Anthropic — создателем Claude. Это не просто бюрократический документ: речь идёт о формировании нового формата отношений между государствами и разработчиками frontier-моделей.

Разберём, что именно подписали стороны, зачем это нужно Австралии и Anthropic, и какой сигнал это посылает остальному миру.