AI Safety

5 материалов

OpenAI раскрывает свою позицию по регулированию ИИ: прозрачность, безопасность, отказ от …

OpenAI вступила в Appia Foundation, чтобы создать общие стандарты оценки и безопасности продвинутого …

OpenAI опубликовала Frontier Governance Framework — публичный документ о безопасности ИИ, …

Что такое reward hacking в RL, почему он неизбежен и как с ним бороться — от классических примеров …

Anthropic открывает Институт — независимую структуру для исследования безопасного ИИ. Разбираем …