
Google I/O 2026: эпоха агентного Gemini наступила
Sundar Pichai о ключевых анонсах Google I/O 2026: Gemini 3.5, Omni, TPU 8-го поколения, Ask YouTube и голосовой ввод в Docs.
Google I/O 2026: эпоха агентного Gemini наступила
«Мы вступили в ту фазу цикла ИИ, когда люди хотят видеть реальную ценность в продуктах, которыми пользуются каждый день.» — Сундар Пичаи, CEO Google и Alphabet
Google I/O 2026 прошёл под знаком одного слова — агентность. Сундар Пичаи открыл конференцию, обозначив главный вектор: ИИ перестаёт быть ассистентом, который «помогает написать текст», и становится полноценным агентом, способным самостоятельно выполнять сложные задачи. Разберём ключевые анонсы.
Масштаб, который говорит сам за себя
Прогресс Google в области ИИ проще всего измерить в токенах — минимальных единицах данных, которые обрабатывают языковые модели. Каждый токен — это, по сути, задача, которую решает ИИ.
- 2 года назад: 9,7 трлн токенов в месяц
- I/O 2025: ~480 трлн токенов в месяц
- I/O 2026: более 3,2 квадриллиона токенов в месяц — рост в 7 раз за год
Сегодня у Google 13 продуктов с более чем миллиардом пользователей каждый, пять из которых перешагнули отметку в 3 миллиарда.
Поиск и Gemini-приложение: рекордный рост
AI Mode теперь работает на базе Gemini 3.5 Flash, а новая умная строка поиска расширяется по мере ввода текста — отражая тенденцию к более длинным и разговорным запросам. AI Overviews (ИИ-сводки в поиске) достигли 2,5 млрд активных пользователей в месяц, а сам AI Mode — уже более 1 млрд MAU всего за год с момента запуска.
Приложение Gemini за год выросло с 400 млн до 900 млн активных пользователей, а количество ежедневных запросов увеличилось более чем в семь раз. Среди новых возможностей — функция Personal Intelligence (персональный интеллект), которая делает ответы более индивидуализированными. За всё время существования генеративных функций было создано свыше 50 млрд изображений с помощью модели Nano Banana.
Новые голосовые и разговорные возможности
Ask Maps — умный поиск в картах
Maps получил крупнейшее обновление за десятилетие, включая функцию Ask Maps. Теперь пользователи могут задавать сложные, развёрнутые вопросы — карта стала настоящим разговорным помощником, а не просто навигатором.
Ask YouTube — переосмысление видеопоиска
Среди анонсов — функция Ask YouTube, которая создаёт принципиально новый опыт взаимодействия с видеоконтентом. Вместо того чтобы смотреть видео целиком, пользователь получает структурированный ответ на свой вопрос — с прямой ссылкой на нужный момент ролика. Функция начинает тестироваться прямо сейчас и выйдет для широкой аудитории в США этим летом.
Docs Live — документы на скорости голоса
Новая функция Docs Live убирает необходимость формулировать точный промпт при создании документа. Достаточно просто говорить — Gemini сам структурирует сказанное в полноценный документ. В будущем появится возможность и редактировать документы голосом.
Новые модели: Gemini 3.5 и Gemini Omni
Gemini 3.5 Flash — скорость + интеллект
Gemini 3.5 Flash стал первой моделью в новой линейке, объединяющей передовой интеллект с агентными возможностями; по производительности он сопоставим с крупными флагманскими моделями, сохраняя при этом скорость серии Flash.
Модель превосходит Gemini 3.1 Pro в тестах по программированию, агентным задачам и мультимодальным бенчмаркам, при этом в 4 раза быстрее конкурентов по количеству выходных токенов в секунду.
Gemini 3.5 Flash идеально подходит для долгосрочных агентных задач: то, на что у разработчика уходили дни или у аудитора — недели, Flash теперь помогает выполнить за долю этого времени, нередко при менее чем половине стоимости других флагманских моделей.
Gemini Omni — любой вход, любой выход
Gemini Omni — новая модель, способная создавать контент из любого входного источника, начиная с видео. Она объединяет интеллект Gemini с лучшими генеративными медиамоделями Google для нового уровня понимания мира, мультимодальности и редактирования.
Gemini Omni сочетает интуитивное понимание физики с обширными знаниями Gemini в области истории, науки и культуры. Модель обладает улучшенным пониманием сил гравитации, кинетической энергии и динамики жидкостей — это позволяет создавать значительно более реалистичные сцены.
Видео, созданные с помощью Omni, содержат цифровой водяной знак SynthID, практически незаметный для человеческого глаза. Проверить подлинность контента можно через приложение Gemini, Gemini в Chrome и поиск Google.
Gemini Omni Flash уже доступен подписчикам Google AI Plus, Pro и Ultra через приложение Gemini и Google Flow.
- Принимает на вход: изображения, текст, видео, аудио
- Генерирует видео, укоренённое в реальных знаниях о мире
- Понимает физику: гравитацию, кинетику, динамику жидкостей
- Поддерживает прямое редактирование сгенерированного контента
- Все видео маркируются водяным знаком SynthID
Сравнение новых моделей Gemini
| Параметр | Gemini 3.5 Flash | Gemini Omni Flash |
|---|---|---|
| Основное применение | Агентные задачи, код, текст | Генерация и редактирование видео |
| Входные данные | Мультимодальные | Изображение, текст, видео, аудио |
| Выходные данные | Текст, код, UI | Видео (изображение и текст — позже) |
| Скорость | 4× быстрее конкурентов | Доступен сейчас |
| Доступность | API, AI Studio, Gemini app | AI Plus / Pro / Ultra |
| Водяной знак | — | SynthID (встроен) |
Инфраструктура: TPU 8-го поколения
Все эти возможности требуют колоссальной вычислительной мощи. Капитальные затраты Google выросли с $31 млрд в 2022 году примерно до $180–190 млрд в 2026-м — шестикратный рост. Ключевой элемент этих инвестиций — собственные чипы TPU (Tensor Processing Unit — тензорный процессор).
22 апреля 2026 года Google объявила о TPU 8-го поколения, впервые разделив архитектуру на два специализированных чипа — для обучения и для инференса.
TPU 8t — чип для обучения моделей
TPU 8t создан для того, чтобы сократить цикл разработки фронтирных моделей с месяцев до недель. Сбалансировав максимальную вычислительную мощность, разделяемую память и межчиповую пропускную способность с лучшей в классе энергоэффективностью, Google получила систему, обеспечивающую почти в 3 раза большую вычислительную производительность на под по сравнению с предыдущим поколением.
Один супер-под TPU 8t объединяет 9600 чипов с двумя петабайтами совместной высокоскоростной памяти HBM при удвоенной межчиповой пропускной способности. Архитектура обеспечивает 121 ExaFLOPS вычислений, что позволяет самым сложным моделям использовать единый огромный пул памяти.
TPU 8i — чип для инференса и агентов
В эпоху агентов пользователи ожидают возможности задавать вопросы, делегировать задачи и получать результаты. TPU 8i разработан для сложной, совместной, итеративной работы множества специализированных агентов, нередко работающих «роем» в сложных потоках.
TPU 8i оснащён наибольшим объёмом встроенной SRAM-памяти среди всех TPU Google, новым ускорителем коллективных операций (CAE) и новой оптимизированной топологией сети Boardfly. Объём встроенной SRAM втрое превышает показатели предыдущего поколения, что позволяет хранить весь KV Cache непосредственно на кремнии и значительно сокращает простои ядер при работе с длинным контекстом.
Оба чипа обеспечивают до двух раз лучшую производительность на ватт — критически важный показатель для устойчивого масштабирования ИИ следующего поколения.
graph TD
A[Google TPU 8-го поколения] --> B[TPU 8t\nОбучение моделей]
A --> C[TPU 8i\nИнференс и агенты]
B --> D[121 ExaFLOPS\n9 600 чипов на под]
B --> E[Сокращение цикла обучения\nс месяцев до недель]
C --> F[3× больше SRAM\nтопология Boardfly]
C --> G[Оптимизация под\nнизкую задержку]
D --> H[Единый кластер\nдо 1 млн TPU]
F --> I[CAE: задержка\nснижена в 5 раз]
Сравнение TPU 8t и TPU 8i
| Характеристика | TPU 8t (обучение) | TPU 8i (инференс) |
|---|---|---|
| Назначение | Обучение фронтирных моделей | Быстрый инференс, агенты |
| Чипов на под | 9 600 | 1 152 |
| Вычисления на под | 121 ExaFLOPS | 11,6 ExaFLOPS |
| Память HBM | 216 ГБ (HBM3e) | 288 ГБ (HBM3e) |
| Встроенная SRAM | — | 384 МБ (×3 к пред. поколению) |
| Ключевое ПО | JAX + Pathways + Virgo | CAE + Boardfly |
| Улучшение цена/произв. | +2,7× vs Ironwood | +80% vs Ironwood |
Gemini Spark и Google Antigravity: агенты для всех
Благодаря улучшениям Google Antigravity — платформы разработки с приоритетом агентов — мы вышли за рамки ИИ-инструментов, которые просто помогают писать, к агентам, способным действовать. Теперь каждый может стать разработчиком.
Gemini Spark будет доступен в приложении Gemini, а также интегрирован в Gmail и Google Workspace, Android и iOS. Spark начнёт работу в бета-версии для подписчиков Google AI Ultra в США уже на следующей неделе.
В Gemini API запускаются Managed Agents (управляемые агенты): один вызов API к агенту Antigravity разворачивает удалённую среду Linux, где агент может рассуждать, планировать, вызывать инструменты, выполнять код в изолированной песочнице и просматривать веб для получения актуальных данных.
Итог: что это значит для пользователей
Google I/O 2026 — это не просто набор обновлений. Это системный сдвиг: компания переходит от демонстрации возможностей ИИ к внедрению агентного интеллекта в каждодневные продукты.
Мы перешли от ИИ, который просто помогает, к агентам, способным самостоятельно справляться со сложными задачами в рамках всего вашего рабочего процесса.
Для российских и русскоязычных пользователей доступность части функций может отличаться в зависимости от региона, однако базовые модели — Gemini 3.5 Flash и Gemini Omni — уже работают через API и доступны разработчикам по всему миру.