Gemini 3.5 Flash: граничный интеллект в действии
Google DeepMind представила Gemini 3.5 Flash — быстрейшую агентную модель, обгоняющую Gemini 3.1 Pro на ключевых бенчмарках при скорости в 4 раза выше конкурентов.
Gemini 3.5 Flash: граничный интеллект в действии
19 мая 2026 года на конференции Google I/O компания Google DeepMind представила Gemini 3.5 — новое семейство моделей, созданных для реального агентного (agentic) использования. Открывает серию модель Gemini 3.5 Flash: она сочетает производительность флагманского уровня со скоростью, которую разработчики привыкли ждать от линейки Flash.
«Frontier intelligence at Flash speed» — именно так охарактеризовал модель Сундар Пичаи на сцене Google I/O 2026.
Что такое Gemini 3.5 Flash и чем она отличается
Gemini 3.5 Flash — это Mid-2026 Flash-tier модель с рассуждением (reasoning), построенная на базе Gemini 3 Flash с явными уровнями «глубины мышления», которые позволяют балансировать качество, стоимость и задержку. Модель принимает на вход текст, изображения, аудио, видео и PDF, генерирует до 64 000 токенов и работает с контекстным окном в 1 млн токенов.
Это нетривиальное заявление: Flash-модель, созданная для скорости и экономичности, превзошла Gemini 3.1 Pro — флагман, вышедший лишь в феврале, — на бенчмарках по кодированию и агентным задачам.
Бенчмарки: Flash бьёт Pro
Gemini 3.5 Flash превосходит Gemini 3.1 Pro на ключевых агентных и кодировочных бенчмарках: Terminal-Bench 2.1 (76,2%), GDPval-AA (1656 Elo) и MCP Atlas (83,6%), а также лидирует в мультимодальном понимании — 84,2% на CharXiv Reasoning.
По количеству генерируемых токенов в секунду модель в 4 раза быстрее других флагманских конкурентов.
Сравнительная таблица: Gemini 3.5 Flash vs. конкуренты
| Бенчмарк | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Opus 4.7 | GPT-5.5 |
|---|---|---|---|---|
| Terminal-Bench 2.1 (кодирование) | 76,2% | 70,3% | — | 78,2% |
| MCP Atlas (агентные задачи) | 83,6% | 78,2% | 79,1% | 75,3% |
| GDPval-AA Elo (реальные задачи) | 1 656 | 1 314 | 1 753 | 1 769 |
| CharXiv Reasoning (мультимодал.) | 84,2% | — | — | 84,1% |
| Finance Agent v2 | 57,9% | 43,0% | — | 51,8% |
| Humanity’s Last Exam | 40,2% | 44,4% | 46,9% | — |
| MRCR v2 @ 128k (длинный контекст) | 77,3% | 84,9% | — | 94,8% |
Коротко: эти цифры означают, что старое правило «быстро, дёшево или умно — выбери два» в ИИ уже не так актуально.
Архитектура агентной работы
Баланс скорости и производительности делает 3.5 Flash идеальным для долгосрочных агентных задач: то, что раньше занимало у разработчика дни, а у аудитора — недели, теперь выполняется за долю этого времени, зачастую менее чем вдвое дороже по сравнению с другими флагманскими моделями.
graph TD
A[Задача пользователя] --> B[Gemini 3.5 Flash]
B --> C{Antigravity Harness}
C --> D[Субагент 1\nПланирование]
C --> E[Субагент 2\nВыполнение кода]
C --> F[Субагент 3\nПроверка результата]
D --> G[Финальный результат]
E --> G
F --> G
Google Antigravity 2.0: платформа для агентов нового поколения
Ключевым дополнением к модели стал обновлённый Google Antigravity 2.0 — агент-ориентированная платформа разработки.
Google анонсировала Antigravity 2.0 — отдельное десктопное приложение, построенное исключительно вокруг оркестрации агентов, а также Antigravity CLI, Antigravity SDK, Managed Agents в Gemini API и корпоративную поддержку через Gemini Enterprise Agent Platform.
Antigravity 2.0 является центральным хабом для агентных взаимодействий, позволяя разработчикам оркестрировать несколько ИИ-агентов параллельно; реализованы «динамические субагенты» для параллельных рабочих потоков, запланированные задачи для фоновой автоматизации и новые интеграции с Google AI Studio, Android и Firebase.
Managed Agents в Gemini API позволяют одним API-вызовом запустить агента, который рассуждает, использует инструменты и выполняет код в изолированной Linux-среде.
gemini-3-flash-preview на gemini-3.5-flash, обязательно явно установите параметр thinking_level: 'high' — в новой версии уровень мышления по умолчанию сменился с high на medium, что может незаметно снизить качество рассуждений вашего агента.import google.generativeai as genai
model = genai.GenerativeModel(
model_name="gemini-3.5-flash",
generation_config={
"thinking_level": "high" # Явно задаём уровень рассуждения
}
)
response = model.generate_content(
"Проанализируй финансовый отчёт и предложи оптимизации"
)
print(response.text)
Реальные кейсы применения
Google совместно с партнёрами уже протестировала 3.5 Flash в реальных корпоративных сценариях:
- Shopify запускает субагентов параллельно для анализа сложных данных на длинном горизонте — с целью получения более точных прогнозов роста продавцов в глобальном масштабе.
- Macquarie Bank пилотирует ускорение онбординга клиентов: модель рассуждает над сложными документами объёмом от 100 страниц, извлекает релевантную информацию и выдаёт рекомендации с низкой задержкой.
- Salesforce интегрирует 3.5 Flash в платформу Agentforce для надёжной автоматизации сложных корпоративных задач через несколько субагентов, сохраняющих контекст и выполняющих многоходовые вызовы инструментов.
- Xero разворачивает агентов для автономного управления многонедельными рабочими процессами — например, для подготовки документов для налоговых форм 1099, позволяя малому бизнесу автоматизировать рутинную бухгалтерию.
- Databricks использует агентные рабочие процессы для мониторинга данных в реальном времени, диагностики проблем и предложения решений для команд data scientists.
Для команд, работающих с долгосрочными рабочими процессами, показательны кейсы Xero и Shopify: многонедельные процессы сжимаются в автоматизированные агентные запуски — именно эту задачу оптимизирует Google, а инфраструктурным слоем для этого служит харнес Antigravity.
Gemini Spark: персональный ИИ-агент
Gemini Spark — персональный ИИ-агент, построенный на базе 3.5 Flash — начал распространяться среди доверенных тестировщиков, а бета-версия запланирована для подписчиков Google AI Ultra в США на следующую неделю.
Gemini Spark работает в режиме 24/7, помогая ориентироваться в цифровой жизни, предпринимая действия от вашего имени под вашим руководством. Это первый опыт Google с полноценным «личным агентом» для массового рынка.
Безопасность и ограничения
Gemini 3.5 разрабатывалась в соответствии с Frontier Safety Framework (Системой обеспечения безопасности на переднем крае). Google усилила защиту в области кибербезопасности и CBRN (химические, биологические, радиологические и ядерные угрозы), применяя новые методы обучения на безопасность, включая инструменты интерпретируемости (interpretability tools) — они позволяют проверить и понять внутреннюю логику ИИ до того, как модель даст ответ.
Цены на API
Стоимость Gemini 3.5 Flash через API составляет $1,50 за 1 млн входящих токенов и $9,00 за 1 млн исходящих токенов; кешированные входные токены — $0,15 за 1 млн (скидка 90%).
Это примерно в 3 раза дороже Gemini 3 Flash Preview ($0,50/$3), но всё ещё примерно на 40% дешевле, чем Gemini 3.1 Pro ($2,50/$15). Модель бесплатна в приложении Gemini и AI Mode в Google Search.
Итог: конец компромисса «качество или скорость»
Попав в верхний правый квадрат индекса Artificial Analysis, 3.5 Flash доказывает: больше не нужно жертвовать качеством ради низкой задержки.
Результат GDPval-AA — 1 656 Elo — намного превышает прежний показатель, что сигнализирует не об инкрементальном прогрессе, а о качественном скачке в агентных возможностях Google.
Для разработчиков, строящих агентные системы в 2026 году, Gemini 3.5 Flash становится новым ориентиром: флагманская производительность на агентных задачах, скорость Flash-класса и цены, которые делают работу с агентами экономически целесообразной даже в высоконагруженных production-сценариях.