Ai-Безопасность on AI-Uchi — Всё об искусственном интеллекте

Исследователи взломали все ведущие AI-бенчмарки

Sun, 12 Apr 2026 17:28:21 +0300

Команда исследователей из UC Berkeley создала автоматического агента, который успешно взломал все 8 ведущих AI-бенчмарков, получив почти идеальные результаты без решения ни одной задачи. Среди взломанных — SWE-bench, WebArena, OSWorld и другие популярные тесты, которые используются для оценки возможностей ИИ-систем.

⚠ Главное открытие

Исследователи доказали, что современные AI-бенчмарки измеряют не способности моделей, а уязвимости в системах оценки. Все тесты можно обмануть без использования LLM.

Как работали эксплойты

Каждый бенчмарк был взломан уникальным способом, использующим недостатки в архитектуре тестирования:

Этика AI: зачем компании нанимают специалистов по AI-безопасности

Wed, 25 Mar 2026 12:00:00 +0300

В 2024 году канадская авиакомпания Air Canada проиграла судебный процесс из-за своего чат-бота. Бот пообещал пассажиру несуществующую скидку на похоронный перелёт — и трибунал постановил: компания несёт ответственность за то, что говорит её ИИ. Год спустя американский адвокат получил штраф за то, что подал в суд юридическую аргументацию с выдуманными прецедентами — ChatGPT их «придумал», а юрист не проверил.

Это не баги. Это системные риски. И именно они объясняют, почему в 2025–2026 годах слова «AI Safety Specialist» и «Chief AI Ethics Officer» из фантастики превратились в самые быстрорастущие позиции на рынке труда.