Google I/O 2026: эпоха агентного Gemini наступила

«Мы вступили в ту фазу цикла ИИ, когда люди хотят видеть реальную ценность в продуктах, которыми пользуются каждый день.» — Сундар Пичаи, CEO Google и Alphabet

Google I/O 2026 прошёл под знаком одного слова — агентность. Сундар Пичаи открыл конференцию, обозначив главный вектор: ИИ перестаёт быть ассистентом, который «помогает написать текст», и становится полноценным агентом, способным самостоятельно выполнять сложные задачи. Разберём ключевые анонсы.

Масштаб, который говорит сам за себя

Прогресс Google в области ИИ проще всего измерить в токенах — минимальных единицах данных, которые обрабатывают языковые модели. Каждый токен — это, по сути, задача, которую решает ИИ.

2 года назад: 9,7 трлн токенов в месяц
I/O 2025: ~480 трлн токенов в месяц
I/O 2026: более 3,2 квадриллиона токенов в месяц — рост в 7 раз за год

ℹ Масштаб разработки

Более 8,5 млн разработчиков ежемесячно создают приложения на основе моделей Google. API моделей обрабатывают около 19 млрд токенов в минуту. За последние 12 месяцев более 375 корпоративных клиентов Google Cloud каждый обработал свыше триллиона токенов.

Сегодня у Google 13 продуктов с более чем миллиардом пользователей каждый, пять из которых перешагнули отметку в 3 миллиарда.

Поиск и Gemini-приложение: рекордный рост

AI Mode теперь работает на базе Gemini 3.5 Flash, а новая умная строка поиска расширяется по мере ввода текста — отражая тенденцию к более длинным и разговорным запросам. AI Overviews (ИИ-сводки в поиске) достигли 2,5 млрд активных пользователей в месяц, а сам AI Mode — уже более 1 млрд MAU всего за год с момента запуска.

Приложение Gemini за год выросло с 400 млн до 900 млн активных пользователей, а количество ежедневных запросов увеличилось более чем в семь раз. Среди новых возможностей — функция Personal Intelligence (персональный интеллект), которая делает ответы более индивидуализированными. За всё время существования генеративных функций было создано свыше 50 млрд изображений с помощью модели Nano Banana.

Новые голосовые и разговорные возможности

Ask Maps — умный поиск в картах

Maps получил крупнейшее обновление за десятилетие, включая функцию Ask Maps. Теперь пользователи могут задавать сложные, развёрнутые вопросы — карта стала настоящим разговорным помощником, а не просто навигатором.

Ask YouTube — переосмысление видеопоиска

Среди анонсов — функция Ask YouTube, которая создаёт принципиально новый опыт взаимодействия с видеоконтентом. Вместо того чтобы смотреть видео целиком, пользователь получает структурированный ответ на свой вопрос — с прямой ссылкой на нужный момент ролика. Функция начинает тестироваться прямо сейчас и выйдет для широкой аудитории в США этим летом.

Docs Live — документы на скорости голоса

Новая функция Docs Live убирает необходимость формулировать точный промпт при создании документа. Достаточно просто говорить — Gemini сам структурирует сказанное в полноценный документ. В будущем появится возможность и редактировать документы голосом.

💡 Когда выйдет?

Docs Live начнёт раскатываться подписчикам этим летом. Мощные голосовые функции также придут в Gmail и Google Keep.

Новые модели: Gemini 3.5 и Gemini Omni

Gemini 3.5 Flash — скорость + интеллект

Gemini 3.5 Flash стал первой моделью в новой линейке, объединяющей передовой интеллект с агентными возможностями; по производительности он сопоставим с крупными флагманскими моделями, сохраняя при этом скорость серии Flash.

Модель превосходит Gemini 3.1 Pro в тестах по программированию, агентным задачам и мультимодальным бенчмаркам, при этом в 4 раза быстрее конкурентов по количеству выходных токенов в секунду.

Gemini 3.5 Flash идеально подходит для долгосрочных агентных задач: то, на что у разработчика уходили дни или у аудитора — недели, Flash теперь помогает выполнить за долю этого времени, нередко при менее чем половине стоимости других флагманских моделей.

Gemini Omni — любой вход, любой выход

Gemini Omni — новая модель, способная создавать контент из любого входного источника, начиная с видео. Она объединяет интеллект Gemini с лучшими генеративными медиамоделями Google для нового уровня понимания мира, мультимодальности и редактирования.

Gemini Omni сочетает интуитивное понимание физики с обширными знаниями Gemini в области истории, науки и культуры. Модель обладает улучшенным пониманием сил гравитации, кинетической энергии и динамики жидкостей — это позволяет создавать значительно более реалистичные сцены.

Видео, созданные с помощью Omni, содержат цифровой водяной знак SynthID, практически незаметный для человеческого глаза. Проверить подлинность контента можно через приложение Gemini, Gemini в Chrome и поиск Google.

Gemini Omni Flash уже доступен подписчикам Google AI Plus, Pro и Ultra через приложение Gemini и Google Flow.

📝 Что умеет Gemini Omni?

Принимает на вход: изображения, текст, видео, аудио
Генерирует видео, укоренённое в реальных знаниях о мире
Понимает физику: гравитацию, кинетику, динамику жидкостей
Поддерживает прямое редактирование сгенерированного контента
Все видео маркируются водяным знаком SynthID

Сравнение новых моделей Gemini

Параметр	Gemini 3.5 Flash	Gemini Omni Flash
Основное применение	Агентные задачи, код, текст	Генерация и редактирование видео
Входные данные	Мультимодальные	Изображение, текст, видео, аудио
Выходные данные	Текст, код, UI	Видео (изображение и текст — позже)
Скорость	4× быстрее конкурентов	Доступен сейчас
Доступность	API, AI Studio, Gemini app	AI Plus / Pro / Ultra
Водяной знак	—	SynthID (встроен)

Инфраструктура: TPU 8-го поколения

Все эти возможности требуют колоссальной вычислительной мощи. Капитальные затраты Google выросли с $31 млрд в 2022 году примерно до $180–190 млрд в 2026-м — шестикратный рост. Ключевой элемент этих инвестиций — собственные чипы TPU (Tensor Processing Unit — тензорный процессор).

22 апреля 2026 года Google объявила о TPU 8-го поколения, впервые разделив архитектуру на два специализированных чипа — для обучения и для инференса.

TPU 8t — чип для обучения моделей

TPU 8t создан для того, чтобы сократить цикл разработки фронтирных моделей с месяцев до недель. Сбалансировав максимальную вычислительную мощность, разделяемую память и межчиповую пропускную способность с лучшей в классе энергоэффективностью, Google получила систему, обеспечивающую почти в 3 раза большую вычислительную производительность на под по сравнению с предыдущим поколением.

Один супер-под TPU 8t объединяет 9600 чипов с двумя петабайтами совместной высокоскоростной памяти HBM при удвоенной межчиповой пропускной способности. Архитектура обеспечивает 121 ExaFLOPS вычислений, что позволяет самым сложным моделям использовать единый огромный пул памяти.

TPU 8i — чип для инференса и агентов

В эпоху агентов пользователи ожидают возможности задавать вопросы, делегировать задачи и получать результаты. TPU 8i разработан для сложной, совместной, итеративной работы множества специализированных агентов, нередко работающих «роем» в сложных потоках.

TPU 8i оснащён наибольшим объёмом встроенной SRAM-памяти среди всех TPU Google, новым ускорителем коллективных операций (CAE) и новой оптимизированной топологией сети Boardfly. Объём встроенной SRAM втрое превышает показатели предыдущего поколения, что позволяет хранить весь KV Cache непосредственно на кремнии и значительно сокращает простои ядер при работе с длинным контекстом.

Оба чипа обеспечивают до двух раз лучшую производительность на ватт — критически важный показатель для устойчивого масштабирования ИИ следующего поколения.


graph TD
    A[Google TPU 8-го поколения] --> B[TPU 8t\nОбучение моделей]
    A --> C[TPU 8i\nИнференс и агенты]
    B --> D[121 ExaFLOPS\n9 600 чипов на под]
    B --> E[Сокращение цикла обучения\nс месяцев до недель]
    C --> F[3× больше SRAM\nтопология Boardfly]
    C --> G[Оптимизация под\nнизкую задержку]
    D --> H[Единый кластер\nдо 1 млн TPU]
    F --> I[CAE: задержка\nснижена в 5 раз]

Сравнение TPU 8t и TPU 8i

Характеристика	TPU 8t (обучение)	TPU 8i (инференс)
Назначение	Обучение фронтирных моделей	Быстрый инференс, агенты
Чипов на под	9 600	1 152
Вычисления на под	121 ExaFLOPS	11,6 ExaFLOPS
Память HBM	216 ГБ (HBM3e)	288 ГБ (HBM3e)
Встроенная SRAM	—	384 МБ (×3 к пред. поколению)
Ключевое ПО	JAX + Pathways + Virgo	CAE + Boardfly
Улучшение цена/произв.	+2,7× vs Ironwood	+80% vs Ironwood

Gemini Spark и Google Antigravity: агенты для всех

Благодаря улучшениям Google Antigravity — платформы разработки с приоритетом агентов — мы вышли за рамки ИИ-инструментов, которые просто помогают писать, к агентам, способным действовать. Теперь каждый может стать разработчиком.

Gemini Spark будет доступен в приложении Gemini, а также интегрирован в Gmail и Google Workspace, Android и iOS. Spark начнёт работу в бета-версии для подписчиков Google AI Ultra в США уже на следующей неделе.

В Gemini API запускаются Managed Agents (управляемые агенты): один вызов API к агенту Antigravity разворачивает удалённую среду Linux, где агент может рассуждать, планировать, вызывать инструменты, выполнять код в изолированной песочнице и просматривать веб для получения актуальных данных.

⚠ Важно для разработчиков

Gemini 3.5 Flash уже доступен через Gemini API и Google AI Studio. Полноценный релиз Gemini 3.5 Pro ожидается в июне 2026 года. Antigravity 2.0 получил отдельное десктопное приложение и CLI для работы из терминала.

Итог: что это значит для пользователей

Google I/O 2026 — это не просто набор обновлений. Это системный сдвиг: компания переходит от демонстрации возможностей ИИ к внедрению агентного интеллекта в каждодневные продукты.

Мы перешли от ИИ, который просто помогает, к агентам, способным самостоятельно справляться со сложными задачами в рамках всего вашего рабочего процесса.

Для российских и русскоязычных пользователей доступность части функций может отличаться в зависимости от региона, однако базовые модели — Gemini 3.5 Flash и Gemini Omni — уже работают через API и доступны разработчикам по всему миру.