Anthropic Claude Mythos: маркетинг вместо прорыва?
Критики ставят под сомнение заявления Anthropic о тысячах уязвимостей в Claude Mythos — анализ основан всего на 198 ручных проверках.
Anthropic заявила, что её новая модель Claude Mythos Preview нашла “тысячи серьёзных уязвимостей” во всех основных операционных системах и браузерах. Однако критики утверждают, что громкие заявления компании основаны на маркетинге, а не на научных данных.
Что не так с заявлениями Anthropic
Anthropic экстраполировала цифру “тысячи уязвимостей” на основе того, что в 90% из 198 вручную проверенных отчётов её эксперты-подрядчики согласились с оценкой серьёзности Claude. При тестировании более 7000 стеков open-source ПО модель нашла только 10 серьёзных уязвимостей и около 600 потенциальных эксплойтов.
В случае с уязвимостью FFmpeg, существующей 16 лет, собственный анализ Anthropic показал: “Эта ошибка не является критической уязвимостью” и “превратить её в работающий эксплойт будет сложно”. Mythos нашел несколько потенциальных эксплойтов в ядре Linux, но не смог воспользоваться ни одним из-за защитных систем.
graph TD
A[Заявление: тысячи уязвимостей] --> B[Реальность: 198 ручных проверок]
B --> C[Экстраполяция на основе 90% совпадений]
C --> D[Фактически: 10 серьёзных уязвимостей из 7000 тестов]
D --> E[Многие уязвимости неэксплуатируемы]
| Параметр | Заявления Anthropic | Реальные данные |
|---|---|---|
| Найдено уязвимостей | Тысячи | ~600 потенциальных |
| Серьёзные уязвимости | Тысячи | 10 подтверждённых |
| Основа для оценки | - | 198 ручных проверок |
| Успешность эксплойтов | 72.4% | Многие неэксплуатируемы |
Независимая проверка ставит под сомнение эксклюзивность
Компания AISLE протестировала конкретные уязвимости, продемонстрированные Anthropic, на небольших и дешёвых open-source моделях. Восемь из восьми моделей обнаружили флагманский FreeBSD-эксплойт Mythos, включая модель с 3.6 миллиардами параметров стоимостью $0.11 за миллион токенов.
Эксперты AISLE отмечают: “Возможности ИИ в кибербезопасности очень неравномерны: они не масштабируются плавно с размером модели, а ров — это система, в которую встроена глубокая экспертиза безопасности, а не сама модель”.
Project Glasswing: защита или продажи?
Anthropic запустила Project Glasswing — инициативу с ограниченным доступом для партнёров, включая AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, Linux Foundation, Microsoft, NVIDIA и Palo Alto Networks. Компания выделила до $100 млн кредитов на использование и $4 млн прямых пожертвований организациям open-source безопасности.
Хотя Mythos может быть способным в отличие от предыдущих моделей, это выглядит как часть маркетинга, часть правды. Для Anthropic это возможность завоевать долю рынка и потенциально выгодные контракты.
Контекст и значение для отрасли
Claude уже стала первой языковой моделью ИИ, получившей допуск службы безопасности для использования правительством США и американскими военными. В прошлом месяце Anthropic пережила утечки данных: сначала случайно раскрыла детали Mythos, затем на три часа выставила почти 2000 файлов исходного кода Claude Code.
Критики указывают на паттерн: компании ИИ-фронтиров всё чаще используют страхи о безопасности для обоснования закрытых релизов и эксклюзивного доступа. Преувеличенные заявления вроде тех, что делают по поводу Claude Mythos, могут подорвать доверие среди разработчиков и исследователей, подчёркивая необходимость прозрачности.