
GPT-Rosalind: новые возможности для науки о жизни
OpenAI обновила GPT-Rosalind: улучшенное биологическое мышление, геномика, медхимия и поддержка лабораторных рабочих процессов.
GPT-Rosalind получает новые возможности: ИИ для науки о жизни выходит на новый уровень
OpenAI продолжает расширять линейку специализированных моделей. На этот раз компания анонсировала крупное обновление GPT-Rosalind — своей флагманской модели, созданной специально для нужд биологических исследований, разработки лекарственных препаратов и трансляционной медицины (направления, переводящего научные открытия в клиническую практику).
Новое обновление серии GPT-Rosalind создано специально для масштабных корпоративных задач в области наук о жизни. Оно объединяет агентические возможности программирования и использования инструментов от GPT-5.5 с более мощным интеллектом модели в ключевых областях разработки лекарств — медицинской химии и геномике — одновременно совершенствуя производительность в широком спектре задач анализа, проектирования и управления экспериментальными рабочими процессами.
«Область наук о жизни требует точности на каждом шагу. Вопросы здесь крайне сложны, данные уникальны, а ставки невероятно высоки.» — Шон Бруик, старший вице-президент по ИИ и данным, Amgen
Почему именно «Розалинд»?
Инструмент получил имя в честь Розалинд Франклин — британского учёного, наиболее известной своей ролью в открытии структуры ДНК. Её работы в области рентгеновской кристаллографии стали фундаментом для понимания двойной спирали ДНК. Название модели — не просто брендинг: оно отражает амбицию OpenAI работать на стыке биологии, химии и вычислений.
Что нового в обновлённой версии?
Прогресс в науках о жизни зависит от синтеза данных и доказательств в различных масштабах и модальностях: молекулы, гены, сигнальные пути и живые системы. По результатам внутренних оценок, обновлённый GPT-Rosalind демонстрирует широкий прирост производительности в исследовательских задачах от экспертов в биологии, сложных запросах по медицинской химии, количественной биологии и устранении неполадок в «мокрых» лабораториях.
1. Расширенное биологическое мышление
Модель разработана для глубокого научного рассуждения, более широкого использования инструментов и баз данных, а также безопасного доступа к многоступенчатым рабочим процессам в таких областях, как понимание белков, анализ геномики и биохимическое рассуждение.
В рамках исследовательского превью модель помогает учёным рассуждать по биологическим данным, использовать инструменты и синтезировать доказательства из множества источников, генерировать и уточнять гипотезы, а также поддерживать многоэтапные рабочие процессы — такие как поиск мишеней, их валидация и планирование экспериментов.
2. Геномика и количественная биология
На бенчмарке GeneBench — агентической оценке долгосрочного комплексного анализа в геномике и количественной биологии — GPT-Rosalind использует на 31% меньше токенов, чем GPT-5.5, при этом достигая более высокой точности: 21,6% против 20,4%. GeneBench оценивает агентическую производительность на долгосрочных количественных задачах: может ли агент планировать корректный анализ, контроль качества, моделирование и коррекцию, чтобы получить ответы, важные для принятия решений? Задачи охватывают функциональную геномику, пространственную транскриптомику, протеомику, эпигеномику и прикладную генетику.
3. Медицинская химия (Medicinal Chemistry)
GPT-Rosalind демонстрирует улучшенный мультимодальный синтез и механистическое рассуждение в медицинской химии. Это особенно важно при проектировании молекул-кандидатов в лекарства: модель способна анализировать структуры соединений, предсказывать их активность и предлагать модификации для улучшения связывающего сродства с биологическими мишенями.
4. Поддержка «мокрых» лабораторий (Wet Lab)
«Мокрая» лаборатория (wet lab) — это реальная исследовательская лаборатория, где учёные работают с биологическими образцами, реагентами и оборудованием.
LabWorkBench тестирует способность модели связывать воздействия с экспериментальными результатами в реальных лабораторных протоколах, используемых учёными — от устранения неполадок до оптимизации. Данные, используемые LabWorkBench, являются проприетарными и, следовательно, незагрязнёнными. GPT-Rosalind набирает 63,2% против 55,8% у GPT-5.5, используя при этом на 5,3% меньше токенов.
Бенчмарки: как модель выглядит на фоне конкурентов?
Для измерения и постоянного улучшения реального воздействия GPT-Rosalind OpenAI разработала LifeSciBench — бенчмарк с внешней экспертной оценкой, сфокусированный на фундаментальных аспектах исследований в области наук о жизни. В отличие от существующих бенчмарков, которые оценивают единственный компонент производительности модели или биологическую область в изоляции, LifeSciBench рассматривает научно ценную работу в комплексе, опираясь на задачи из шести рабочих областей, ключевых для исследований в области наук о жизни.
| Бенчмарк | GPT-Rosalind | GPT-5.5 / GPT-5.4 | Gemini 3.1 Pro | Grok 4.2 |
|---|---|---|---|---|
| BixBench (Pass@1) | 0.751–0.761 | 0.728 | 0.550 | 0.698 |
| GeneBench (точность) | 21.6% | 20.4% (GPT-5.5) | — | — |
| LabWorkBench | 63.2% | 55.8% (GPT-5.5) | — | — |
| LABBench2 (из 11 задач) | 6/11 лучше GPT-5.4 | база | — | — |
В оценке с использованием неопубликованных, «незагрязнённых» РНК-последовательностей, предоставленных компанией Dyno Therapeutics, GPT-Rosalind был задействован для предсказания и генерации последовательностей. При оценке непосредственно в среде Codex результаты модели превысили 95-й процентиль среди экспертов-людей в задачах предсказания и достигли 84-го процентиля в задачах генерации последовательностей.
graph TD
A[Исследователь формулирует задачу] --> B[GPT-Rosalind анализирует литературу]
B --> C[Генерация гипотезы]
C --> D[Планирование эксперимента]
D --> E[Wet lab: синтез / секвенирование]
E --> F[Анализ данных и интерпретация]
F --> G[Уточнение гипотезы или вывод]
G --> C
Экосистема инструментов: плагины для Codex
Вместе с моделью поставляется бесплатный плагин для исследований в области наук о жизни для Codex, открытый на GitHub, который подключает учёных к более чем 50 публичным базам данных, источникам литературы и биологическим инструментам — например, для поиска структуры белков и поиска последовательностей.
Плагин действует как оркестрирующий уровень, предоставляя модульные навыки, охватывающие генетику человека, функциональную геномику и клинические данные. Он включает точку входа «исследовательский маршрутизатор», которая может синтезировать обоснованные доказательствами ответы и задействовать субагентов для параллельной работы, когда потоки данных независимы.
- 🔬 Поиск и валидация мишеней — выявление биологических мишеней для новых лекарств в геномных, протеомных и других данных
- 📚 Синтез литературы — анализ миллионов научных публикаций и структурированных баз данных
- 🧬 Интерпретация последовательность → функция — предсказание функции белков и нуклеиновых кислот по их последовательностям
- 🧪 Планирование и отладка экспериментов — разработка протоколов и поиск причин неудачных опытов
Для кого создана модель?
Модель наилучшим образом подходит для биоинформатиков, вычислительных биологов и биологов, занимающихся ранними стадиями открытий. Сейчас модель наиболее ценна для ранних стадий открытий и генерации гипотез — особенно для изучения биологии мишеней, понимания механизмов действия, синтеза литературы и интерпретации омиксных данных.
Доступ и партнёры
GPT-Rosalind теперь доступен в режиме исследовательского превью для организаций по всему миру в рамках структуры доверенного доступа.
Учитывая потенциальную мощь модели, способной перепроектировать биологические структуры, OpenAI отказалась от широкого выпуска в пользу программы доверенного доступа (Trusted Access). Модель запускается как исследовательский превью специально для квалифицированных корпоративных клиентов.
Ограниченное развёртывание основано на трёх ключевых принципах: полезное использование, строгое управление и контролируемый доступ. Организации, запрашивающие доступ, должны пройти квалификационную и проверку безопасности, чтобы убедиться, что они проводят законные исследования с чёткой общественной пользой.
OpenAI назвала Amgen, Moderna, Allen Institute, Thermo Fisher Scientific и Novo Nordisk в числе первых партнёров при запуске GPT-Rosalind.
Биозащита и общественная польза
Это также означает применение ИИ в науках о жизни для работ с высоким общественным значением — от разработки лекарств и трансляционной медицины до здравоохранения, готовности к чрезвычайным ситуациям и биологической защиты. Через программу Rosalind Biodefense и модель развёртывания с доверенным доступом OpenAI стремится предоставить передовые биологические возможности в руки исследователей, институтов и специалистов по защите, работающих над улучшением здоровья людей и укреплением устойчивости общества.
Конкурентный ландшафт
Ключевое различие между игроками рынка таково: компании вроде Isomorphic Labs и их аналоги строят лекарственные пайплайны. OpenAI строит модель рассуждений, в которую пайплайны могут интегрироваться.
GPT-Rosalind — это модель рассуждений, которая может планировать и оркестрировать научные рабочие процессы, включая вызов инструментов предсказания структуры, таких как AlphaFold 3, и предназначена для таких задач, как синтез литературы, проектирование экспериментов и генерация реагентов.
Взгляд в будущее
OpenAI продолжит создание GPT-Rosalind как всё более мощного партнёра на протяжении всего жизненного цикла научных исследований, помогая учёным быстрее переходить от правильных вопросов к более чётким доказательствам, лучшим экспериментам и, в конечном счёте, к новым методам лечения для пациентов.
В США в среднем требуется от 10 до 15 лет, чтобы новое лекарство прошло путь от первоначального обнаружения мишени до получения регуляторного одобрения. OpenAI предполагает, что достижения на самых ранних стадиях открытий — такие как лучший выбор мишеней и более обоснованные биологические гипотезы — создают эффект накопления, улучшая качество всех последующих экспериментов.
GPT-Rosalind — это не просто новая модель. Это заявка OpenAI на долгосрочное лидерство в одной из наиболее важных и сложных областей применения ИИ — ускорении научных открытий ради здоровья людей.