Когда AI не согласен с врачом

Финский разработчик Антуан опубликовал детальный разбор эксперимента: он использовал Claude Code с моделью Opus 4.8 для анализа своего МРТ правого плеча — и получил заключение, которое кардинально расходится с тем, что ему поставила клиника. История быстро разошлась на Hacker News и поставила острый вопрос: насколько сегодня можно доверять AI в медицинской диагностике?

⚠ Важный дисклеймер
Эта статья носит информационный характер. Ни материалы источника, ни данная публикация не являются медицинской рекомендацией. При проблемах со здоровьем обращайтесь к квалифицированным специалистам.

Как всё началось: подозрительные назначения

Антуан обратился к ортопеду с болью в правом плече, которая продолжалась несколько недель. Клиника назначила МРТ и поставила диагноз: разрыв сухожилия подлопаточной мышцы (subscapularis tendon) степени Grade III — то есть частичный разрыв толщиной более 50% в апикальной зоне прикрепления. Лечение началось практически сразу после снимков.

Получив на руки результаты, он отправил их сначала в GPT 5.5 Pro — и тот сразу же поднял два красных флага:

Клиника провела ударно-волновую терапию (shockwave therapy), хотя актуальное клиническое руководство прямо указывает: её не следует применять при тендинопатии ротаторной манжеты без кальцификации — а кальцификации у пациента не было.

Пациенту ввели Traumeel — препарат, зарегистрированный в Германии как гомеопатическое средство «без терапевтического показания».

Доверие к клинике упало — и Антуан решил провести полноценный AI-анализ снимков.

Техническая сторона: DICOM + Claude Code

МРТ-пакет представлял собой стандартный DICOM-экспорт (формат медицинских изображений): несколько сотен файлов без расширений, общим объёмом около 266 МБ.

Для анализа был выбран Claude Code — агентная среда Anthropic, в которой модель может самостоятельно писать и выполнять код, устанавливать пакеты и работать с файловой системой. Это принципиальное отличие от обычного чата.

ℹ Claude Code vs Claude.ai
Разница между Claude Code и обычным чатом Claude.ai огромна даже при работе с одной моделью: агентный режим позволяет модели самостоятельно запускать код, устанавливать библиотеки и итеративно работать с данными — без участия пользователя в каждом шаге.

Модели дали единственное указание контекста: «боль в правом плече 2–3 недели». Примерно через час Claude Code вернул развёрнутый PDF-отчёт.

Результат: диаметрально противоположный вывод

Вот где история становится по-настоящему интригующей:

Там, где врач увидел разрыв Grade III (>50%), Opus 4.8 зафиксировал интактное (неповреждённое) сухожилие.

Расхождение слишком радикальное, чтобы его игнорировать. Антуан решил провести «арбитраж» — попросил Claude Code сравнить оба заключения, предоставив дополнительный контекст: оригинальный врачебный отчёт и переписку с ChatGPT 4o о диагностических тестах через движения.

Для минимизации предвзятости Opus использовал несколько независимых субагентов, которые анализировали снимки заново — без доступа к предыдущим выводам.


graph TD
    A[МРТ-снимки, 266 МБ DICOM] --> B[Claude Code + Opus 4.8]
    B --> C[Первичный отчёт:\nСухожилие интактно]
    D[Врач-ортопед] --> E[Диагноз:\nGrade III разрыв >50%]
    C --> F[Арбитраж: сравнение двух отчётов]
    E --> F
    G[ChatGPT 5.5 Pro\nдиагностические тесты] --> F
    F --> H[Вердикт арбитра:\nМягкий тендиноз, разрыва нет]

Вердикт арбитра

Финальный арбитражный отчёт встал на сторону AI-анализа с умеренно-высокой уверенностью: лёгкий инсерционный тендиноз, без дискретного частичного или полного разрыва — включая апикальную зону прикрепления.

Сравнение подходов

ПараметрВрач-ортопедClaude Code (Opus 4.8)
ДиагнозGrade III разрыв >50%Интактное сухожилие
Время анализа~30 минут приёма~1 час автономной работы
МетодологияВизуальная оценкаDICOM-анализ + мульти-агентная верификация
Назначено лечениеУдарно-волновая терапия + инъекции
Уверенность выводаЛечение начато сразуModerate-to-high confidence
💡 Что такое мульти-агентная верификация
При арбитраже Claude запускал несколько независимых субагентов — каждый анализировал снимки с нуля, без знания выводов других. Это снижает риск «галлюцинаций» и систематических ошибок, характерных для единственного прохода модели.

Где это оставляет нас

Антуан честно признаётся: он оказался в состоянии информационного паралича. AI указал на потенциальные проблемы с назначениями — но стопроцентно доверять ему тоже нельзя. Ошибиться мог врач, ошибиться мог AI, мог ошибиться и сам пациент в интерпретации.

При этом история вписывается в более широкий тренд. В начале 2026 года Anthropic анонсировала «Claude for Healthcare» — набор HIPAA-совместимых AI-инструментов с доменной интеграцией для медицины. Параллельно исследователи уже сравнивают ChatGPT-4o, Gemini 2.5 Pro и Claude 4 Opus в задачах анализа МРТ-снимков мозга.

По данным AMA, в 2024 году 66% американских врачей использовали AI в практике — по сравнению с 38% в 2023 году. Но использование в кабинете врача и автономная замена врача — разные вещи.

📝 Перспектива автора
«Моя надежда в том, что через пару поколений моделей мы будем доверять AI для проверки МРТ так же, как сейчас доверяем ему проверку орфографии» — Антуан, автор эксперимента.

Что это значит для отрасли

Эксперимент наглядно демонстрирует одновременно силу и ограниченность современных AI-инструментов в медицине:

  • Сила: способность за час самостоятельно разобрать сотни DICOM-файлов, кросс-верифицировать выводы через несколько субагентов и сравнить два противоречивых отчёта
  • Ограничение: невозможность верифицировать результат без привлечения второго независимого специалиста-человека
  • Риск: ложное чувство уверенности в любую сторону — как слепое доверие AI, так и слепое доверие врачу

Пока AI-анализ МРТ остаётся инструментом информированного пациента, а не заменой диагностики. Но планка явно поднимается — и подобные эксперименты ускоряют разговор о том, где и как AI должен встроиться в медицинский процесс.