Gemini 3.5 Flash: граничный интеллект в действии

19 мая 2026 года на конференции Google I/O компания Google DeepMind представила Gemini 3.5 — новое семейство моделей, созданных для реального агентного (agentic) использования. Открывает серию модель Gemini 3.5 Flash: она сочетает производительность флагманского уровня со скоростью, которую разработчики привыкли ждать от линейки Flash.

«Frontier intelligence at Flash speed» — именно так охарактеризовал модель Сундар Пичаи на сцене Google I/O 2026.

Что такое Gemini 3.5 Flash и чем она отличается

Gemini 3.5 Flash — это Mid-2026 Flash-tier модель с рассуждением (reasoning), построенная на базе Gemini 3 Flash с явными уровнями «глубины мышления», которые позволяют балансировать качество, стоимость и задержку. Модель принимает на вход текст, изображения, аудио, видео и PDF, генерирует до 64 000 токенов и работает с контекстным окном в 1 млн токенов.

Это нетривиальное заявление: Flash-модель, созданная для скорости и экономичности, превзошла Gemini 3.1 Pro — флагман, вышедший лишь в феврале, — на бенчмарках по кодированию и агентным задачам.

ℹ Доступность
Gemini 3.5 Flash стала общедоступной 19 мая 2026 года: через приложение Gemini, AI Mode в Google Search, Google AI Studio, Android Studio, Gemini API, платформу Gemini Enterprise Agent Platform и Gemini Enterprise. Одновременно Google анонсировала работу над Gemini 3.5 Pro, которая уже используется внутри компании и выйдет в июне 2026 года.

Бенчмарки: Flash бьёт Pro

Gemini 3.5 Flash превосходит Gemini 3.1 Pro на ключевых агентных и кодировочных бенчмарках: Terminal-Bench 2.1 (76,2%), GDPval-AA (1656 Elo) и MCP Atlas (83,6%), а также лидирует в мультимодальном понимании — 84,2% на CharXiv Reasoning.

По количеству генерируемых токенов в секунду модель в 4 раза быстрее других флагманских конкурентов.

Сравнительная таблица: Gemini 3.5 Flash vs. конкуренты

БенчмаркGemini 3.5 FlashGemini 3.1 ProClaude Opus 4.7GPT-5.5
Terminal-Bench 2.1 (кодирование)76,2%70,3%78,2%
MCP Atlas (агентные задачи)83,6%78,2%79,1%75,3%
GDPval-AA Elo (реальные задачи)1 6561 3141 7531 769
CharXiv Reasoning (мультимодал.)84,2%84,1%
Finance Agent v257,9%43,0%51,8%
Humanity’s Last Exam40,2%44,4%46,9%
MRCR v2 @ 128k (длинный контекст)77,3%84,9%94,8%

Коротко: эти цифры означают, что старое правило «быстро, дёшево или умно — выбери два» в ИИ уже не так актуально.

⚠ Важное уточнение
Гемини 3.5 Flash уступает Gemini 3.1 Pro на задачах с длинным контекстом (MRCR v2 @ 128k: 77,3% против 84,9%) и чистым академическим рассуждением (Humanity’s Last Exam). Если ваши задачи связаны с глубоким поиском по документам или научными выводами — пока лучше использовать Gemini 3.1 Pro или дождаться Gemini 3.5 Pro.

Архитектура агентной работы

Баланс скорости и производительности делает 3.5 Flash идеальным для долгосрочных агентных задач: то, что раньше занимало у разработчика дни, а у аудитора — недели, теперь выполняется за долю этого времени, зачастую менее чем вдвое дороже по сравнению с другими флагманскими моделями.


graph TD
    A[Задача пользователя] --> B[Gemini 3.5 Flash]
    B --> C{Antigravity Harness}
    C --> D[Субагент 1\nПланирование]
    C --> E[Субагент 2\nВыполнение кода]
    C --> F[Субагент 3\nПроверка результата]
    D --> G[Финальный результат]
    E --> G
    F --> G

Google Antigravity 2.0: платформа для агентов нового поколения

Ключевым дополнением к модели стал обновлённый Google Antigravity 2.0 — агент-ориентированная платформа разработки.

Google анонсировала Antigravity 2.0 — отдельное десктопное приложение, построенное исключительно вокруг оркестрации агентов, а также Antigravity CLI, Antigravity SDK, Managed Agents в Gemini API и корпоративную поддержку через Gemini Enterprise Agent Platform.

Antigravity 2.0 является центральным хабом для агентных взаимодействий, позволяя разработчикам оркестрировать несколько ИИ-агентов параллельно; реализованы «динамические субагенты» для параллельных рабочих потоков, запланированные задачи для фоновой автоматизации и новые интеграции с Google AI Studio, Android и Firebase.

Managed Agents в Gemini API позволяют одним API-вызовом запустить агента, который рассуждает, использует инструменты и выполняет код в изолированной Linux-среде.

💡 Совет разработчику
Если вы переходите с gemini-3-flash-preview на gemini-3.5-flash, обязательно явно установите параметр thinking_level: 'high' — в новой версии уровень мышления по умолчанию сменился с high на medium, что может незаметно снизить качество рассуждений вашего агента.
import google.generativeai as genai

model = genai.GenerativeModel(
    model_name="gemini-3.5-flash",
    generation_config={
        "thinking_level": "high"  # Явно задаём уровень рассуждения
    }
)

response = model.generate_content(
    "Проанализируй финансовый отчёт и предложи оптимизации"
)
print(response.text)

Реальные кейсы применения

Google совместно с партнёрами уже протестировала 3.5 Flash в реальных корпоративных сценариях:

  • Shopify запускает субагентов параллельно для анализа сложных данных на длинном горизонте — с целью получения более точных прогнозов роста продавцов в глобальном масштабе.
  • Macquarie Bank пилотирует ускорение онбординга клиентов: модель рассуждает над сложными документами объёмом от 100 страниц, извлекает релевантную информацию и выдаёт рекомендации с низкой задержкой.
  • Salesforce интегрирует 3.5 Flash в платформу Agentforce для надёжной автоматизации сложных корпоративных задач через несколько субагентов, сохраняющих контекст и выполняющих многоходовые вызовы инструментов.
  • Xero разворачивает агентов для автономного управления многонедельными рабочими процессами — например, для подготовки документов для налоговых форм 1099, позволяя малому бизнесу автоматизировать рутинную бухгалтерию.
  • Databricks использует агентные рабочие процессы для мониторинга данных в реальном времени, диагностики проблем и предложения решений для команд data scientists.

Для команд, работающих с долгосрочными рабочими процессами, показательны кейсы Xero и Shopify: многонедельные процессы сжимаются в автоматизированные агентные запуски — именно эту задачу оптимизирует Google, а инфраструктурным слоем для этого служит харнес Antigravity.

Gemini Spark: персональный ИИ-агент

Gemini Spark — персональный ИИ-агент, построенный на базе 3.5 Flash — начал распространяться среди доверенных тестировщиков, а бета-версия запланирована для подписчиков Google AI Ultra в США на следующую неделю.

Gemini Spark работает в режиме 24/7, помогая ориентироваться в цифровой жизни, предпринимая действия от вашего имени под вашим руководством. Это первый опыт Google с полноценным «личным агентом» для массового рынка.

Безопасность и ограничения

Gemini 3.5 разрабатывалась в соответствии с Frontier Safety Framework (Системой обеспечения безопасности на переднем крае). Google усилила защиту в области кибербезопасности и CBRN (химические, биологические, радиологические и ядерные угрозы), применяя новые методы обучения на безопасность, включая инструменты интерпретируемости (interpretability tools) — они позволяют проверить и понять внутреннюю логику ИИ до того, как модель даст ответ.

📝 Пример применения
Сценарий для разработчика: используйте Gemini 3.5 Flash для агентной обработки сложных рабочих процессов — анализ кода, рефакторинг, разработка UI. Для задач, требующих глубокого извлечения информации из длинных документов, пока оставайтесь на Gemini 3.1 Pro. Оптимальная стратегия — маршрутизация по типу задачи.

Цены на API

Стоимость Gemini 3.5 Flash через API составляет $1,50 за 1 млн входящих токенов и $9,00 за 1 млн исходящих токенов; кешированные входные токены — $0,15 за 1 млн (скидка 90%).

Это примерно в 3 раза дороже Gemini 3 Flash Preview ($0,50/$3), но всё ещё примерно на 40% дешевле, чем Gemini 3.1 Pro ($2,50/$15). Модель бесплатна в приложении Gemini и AI Mode в Google Search.

Итог: конец компромисса «качество или скорость»

Попав в верхний правый квадрат индекса Artificial Analysis, 3.5 Flash доказывает: больше не нужно жертвовать качеством ради низкой задержки.

Результат GDPval-AA — 1 656 Elo — намного превышает прежний показатель, что сигнализирует не об инкрементальном прогрессе, а о качественном скачке в агентных возможностях Google.

Для разработчиков, строящих агентные системы в 2026 году, Gemini 3.5 Flash становится новым ориентиром: флагманская производительность на агентных задачах, скорость Flash-класса и цены, которые делают работу с агентами экономически целесообразной даже в высоконагруженных production-сценариях.