GPT-Rosalind: новые возможности для науки о жизни

GPT-Rosalind получает новые возможности: ИИ для науки о жизни выходит на новый уровень

OpenAI продолжает расширять линейку специализированных моделей. На этот раз компания анонсировала крупное обновление GPT-Rosalind — своей флагманской модели, созданной специально для нужд биологических исследований, разработки лекарственных препаратов и трансляционной медицины (направления, переводящего научные открытия в клиническую практику).

Новое обновление серии GPT-Rosalind создано специально для масштабных корпоративных задач в области наук о жизни. Оно объединяет агентические возможности программирования и использования инструментов от GPT-5.5 с более мощным интеллектом модели в ключевых областях разработки лекарств — медицинской химии и геномике — одновременно совершенствуя производительность в широком спектре задач анализа, проектирования и управления экспериментальными рабочими процессами.

«Область наук о жизни требует точности на каждом шагу. Вопросы здесь крайне сложны, данные уникальны, а ставки невероятно высоки.» — Шон Бруик, старший вице-президент по ИИ и данным, Amgen

Почему именно «Розалинд»?

Инструмент получил имя в честь Розалинд Франклин — британского учёного, наиболее известной своей ролью в открытии структуры ДНК. Её работы в области рентгеновской кристаллографии стали фундаментом для понимания двойной спирали ДНК. Название модели — не просто брендинг: оно отражает амбицию OpenAI работать на стыке биологии, химии и вычислений.

ℹ Что такое трансляционная медицина?

Трансляционная медицина (translational medicine) — это направление науки, которое переводит открытия из лаборатории в клинику: от молекулярных мишеней до готовых лекарств для пациентов. GPT-Rosalind ориентирован именно на ускорение этого пути.

Что нового в обновлённой версии?

Прогресс в науках о жизни зависит от синтеза данных и доказательств в различных масштабах и модальностях: молекулы, гены, сигнальные пути и живые системы. По результатам внутренних оценок, обновлённый GPT-Rosalind демонстрирует широкий прирост производительности в исследовательских задачах от экспертов в биологии, сложных запросах по медицинской химии, количественной биологии и устранении неполадок в «мокрых» лабораториях.

1. Расширенное биологическое мышление

Модель разработана для глубокого научного рассуждения, более широкого использования инструментов и баз данных, а также безопасного доступа к многоступенчатым рабочим процессам в таких областях, как понимание белков, анализ геномики и биохимическое рассуждение.

В рамках исследовательского превью модель помогает учёным рассуждать по биологическим данным, использовать инструменты и синтезировать доказательства из множества источников, генерировать и уточнять гипотезы, а также поддерживать многоэтапные рабочие процессы — такие как поиск мишеней, их валидация и планирование экспериментов.

2. Геномика и количественная биология

На бенчмарке GeneBench — агентической оценке долгосрочного комплексного анализа в геномике и количественной биологии — GPT-Rosalind использует на 31% меньше токенов, чем GPT-5.5, при этом достигая более высокой точности: 21,6% против 20,4%. GeneBench оценивает агентическую производительность на долгосрочных количественных задачах: может ли агент планировать корректный анализ, контроль качества, моделирование и коррекцию, чтобы получить ответы, важные для принятия решений? Задачи охватывают функциональную геномику, пространственную транскриптомику, протеомику, эпигеномику и прикладную генетику.

3. Медицинская химия (Medicinal Chemistry)

GPT-Rosalind демонстрирует улучшенный мультимодальный синтез и механистическое рассуждение в медицинской химии. Это особенно важно при проектировании молекул-кандидатов в лекарства: модель способна анализировать структуры соединений, предсказывать их активность и предлагать модификации для улучшения связывающего сродства с биологическими мишенями.

4. Поддержка «мокрых» лабораторий (Wet Lab)

«Мокрая» лаборатория (wet lab) — это реальная исследовательская лаборатория, где учёные работают с биологическими образцами, реагентами и оборудованием.

LabWorkBench тестирует способность модели связывать воздействия с экспериментальными результатами в реальных лабораторных протоколах, используемых учёными — от устранения неполадок до оптимизации. Данные, используемые LabWorkBench, являются проприетарными и, следовательно, незагрязнёнными. GPT-Rosalind набирает 63,2% против 55,8% у GPT-5.5, используя при этом на 5,3% меньше токенов.

💡 Практический пример

Исследователь может попросить GPT-Rosalind разработать эксперимент по клонированию, извлечь данные о последовательностях из репозитория, составить лабораторный протокол и передать работу роботизированному жидкостному обработчику — всё в рамках единого рабочего процесса.

Бенчмарки: как модель выглядит на фоне конкурентов?

Для измерения и постоянного улучшения реального воздействия GPT-Rosalind OpenAI разработала LifeSciBench — бенчмарк с внешней экспертной оценкой, сфокусированный на фундаментальных аспектах исследований в области наук о жизни. В отличие от существующих бенчмарков, которые оценивают единственный компонент производительности модели или биологическую область в изоляции, LifeSciBench рассматривает научно ценную работу в комплексе, опираясь на задачи из шести рабочих областей, ключевых для исследований в области наук о жизни.

Бенчмарк	GPT-Rosalind	GPT-5.5 / GPT-5.4	Gemini 3.1 Pro	Grok 4.2
BixBench (Pass@1)	0.751–0.761	0.728	0.550	0.698
GeneBench (точность)	21.6%	20.4% (GPT-5.5)	—	—
LabWorkBench	63.2%	55.8% (GPT-5.5)	—	—
LABBench2 (из 11 задач)	6/11 лучше GPT-5.4	база	—	—

В оценке с использованием неопубликованных, «незагрязнённых» РНК-последовательностей, предоставленных компанией Dyno Therapeutics, GPT-Rosalind был задействован для предсказания и генерации последовательностей. При оценке непосредственно в среде Codex результаты модели превысили 95-й процентиль среди экспертов-людей в задачах предсказания и достигли 84-го процентиля в задачах генерации последовательностей.


graph TD
    A[Исследователь формулирует задачу] --> B[GPT-Rosalind анализирует литературу]
    B --> C[Генерация гипотезы]
    C --> D[Планирование эксперимента]
    D --> E[Wet lab: синтез / секвенирование]
    E --> F[Анализ данных и интерпретация]
    F --> G[Уточнение гипотезы или вывод]
    G --> C

Экосистема инструментов: плагины для Codex

Вместе с моделью поставляется бесплатный плагин для исследований в области наук о жизни для Codex, открытый на GitHub, который подключает учёных к более чем 50 публичным базам данных, источникам литературы и биологическим инструментам — например, для поиска структуры белков и поиска последовательностей.

Плагин действует как оркестрирующий уровень, предоставляя модульные навыки, охватывающие генетику человека, функциональную геномику и клинические данные. Он включает точку входа «исследовательский маршрутизатор», которая может синтезировать обоснованные доказательствами ответы и задействовать субагентов для параллельной работы, когда потоки данных независимы.

📝 Типичные задачи для GPT-Rosalind

🔬 Поиск и валидация мишеней — выявление биологических мишеней для новых лекарств в геномных, протеомных и других данных
📚 Синтез литературы — анализ миллионов научных публикаций и структурированных баз данных
🧬 Интерпретация последовательность → функция — предсказание функции белков и нуклеиновых кислот по их последовательностям
🧪 Планирование и отладка экспериментов — разработка протоколов и поиск причин неудачных опытов

Для кого создана модель?

Модель наилучшим образом подходит для биоинформатиков, вычислительных биологов и биологов, занимающихся ранними стадиями открытий. Сейчас модель наиболее ценна для ранних стадий открытий и генерации гипотез — особенно для изучения биологии мишеней, понимания механизмов действия, синтеза литературы и интерпретации омиксных данных.

Доступ и партнёры

GPT-Rosalind теперь доступен в режиме исследовательского превью для организаций по всему миру в рамках структуры доверенного доступа.

Учитывая потенциальную мощь модели, способной перепроектировать биологические структуры, OpenAI отказалась от широкого выпуска в пользу программы доверенного доступа (Trusted Access). Модель запускается как исследовательский превью специально для квалифицированных корпоративных клиентов.

Ограниченное развёртывание основано на трёх ключевых принципах: полезное использование, строгое управление и контролируемый доступ. Организации, запрашивающие доступ, должны пройти квалификационную и проверку безопасности, чтобы убедиться, что они проводят законные исследования с чёткой общественной пользой.

OpenAI назвала Amgen, Moderna, Allen Institute, Thermo Fisher Scientific и Novo Nordisk в числе первых партнёров при запуске GPT-Rosalind.

⚠ Ограниченный доступ

На данный момент GPT-Rosalind недоступен для индивидуальных исследователей без институциональной принадлежности или небольших биотех-стартапов, не прошедших квалификационный отбор. Это сознательное решение OpenAI, связанное с двойственным характером биологических технологий: модель, способная интерпретировать геномные данные, рассуждать о биологии патогенов и предлагать молекулярные модификации, в неправильных руках могла бы помочь в создании опасных патогенов или биологических агентов.

Биозащита и общественная польза

Это также означает применение ИИ в науках о жизни для работ с высоким общественным значением — от разработки лекарств и трансляционной медицины до здравоохранения, готовности к чрезвычайным ситуациям и биологической защиты. Через программу Rosalind Biodefense и модель развёртывания с доверенным доступом OpenAI стремится предоставить передовые биологические возможности в руки исследователей, институтов и специалистов по защите, работающих над улучшением здоровья людей и укреплением устойчивости общества.

Конкурентный ландшафт

Ключевое различие между игроками рынка таково: компании вроде Isomorphic Labs и их аналоги строят лекарственные пайплайны. OpenAI строит модель рассуждений, в которую пайплайны могут интегрироваться.

GPT-Rosalind — это модель рассуждений, которая может планировать и оркестрировать научные рабочие процессы, включая вызов инструментов предсказания структуры, таких как AlphaFold 3, и предназначена для таких задач, как синтез литературы, проектирование экспериментов и генерация реагентов.

Взгляд в будущее

OpenAI продолжит создание GPT-Rosalind как всё более мощного партнёра на протяжении всего жизненного цикла научных исследований, помогая учёным быстрее переходить от правильных вопросов к более чётким доказательствам, лучшим экспериментам и, в конечном счёте, к новым методам лечения для пациентов.

В США в среднем требуется от 10 до 15 лет, чтобы новое лекарство прошло путь от первоначального обнаружения мишени до получения регуляторного одобрения. OpenAI предполагает, что достижения на самых ранних стадиях открытий — такие как лучший выбор мишеней и более обоснованные биологические гипотезы — создают эффект накопления, улучшая качество всех последующих экспериментов.

GPT-Rosalind — это не просто новая модель. Это заявка OpenAI на долгосрочное лидерство в одной из наиболее важных и сложных областей применения ИИ — ускорении научных открытий ради здоровья людей.

GPT-Rosalind получает новые возможности: ИИ для науки о жизни выходит на новый уровень

Почему именно «Розалинд»?

Что нового в обновлённой версии?

1. Расширенное биологическое мышление

2. Геномика и количественная биология

3. Медицинская химия (Medicinal Chemistry)

4. Поддержка «мокрых» лабораторий (Wet Lab)

Бенчмарки: как модель выглядит на фоне конкурентов?

Экосистема инструментов: плагины для Codex

Для кого создана модель?

Доступ и партнёры

Биозащита и общественная польза

Конкурентный ландшафт

Взгляд в будущее

Источники

Похожие статьи

Биозащита в эпоху ИИ: план действий OpenAI

GPT-Live: новое поколение голосовых моделей OpenAI

HP Inc. и OpenAI: стратегическое партнёрство Frontier

OpenAI Partner Network: $150 млн на внедрение AI в бизнес

Модели OpenAI и Codex теперь доступны через Oracle Cloud