
9 демо Gemini Omni и Gemini 3.5: что умеют новые модели Google
Разбираем 9 демонстраций Gemini Omni и Gemini 3.5 Flash с Google I/O 2026: видеоредактирование, агентные задачи и персональный ИИ-агент Spark.
9 демо Gemini Omni и Gemini 3.5: что умеют новые модели Google
На конференции Google I/O 2026 компания представила сразу два семейства моделей, каждое из которых решает принципиально разные задачи. С Gemini Omni способность рассуждать встречается со способностью создавать, а Gemini 3.5 создан для выполнения сложных агентных рабочих процессов.
«С мировыми моделями ИИ переходит от предсказания текста к симуляции реальности. Gemini Omni — следующий шаг в этом направлении». — Сундар Пичаи, CEO Google
Чтобы разобраться, на что способны новые инструменты, Google опубликовал девять демонстрационных роликов. Ниже — подробный разбор каждого.
Gemini Omni: когда видео редактируется разговором
Gemini Omni — принципиально новая модель, которая создаёт динамичный видеоконтент, объединяя текстовые, аудио-, изображённые и видеовходы. Главная её особенность — не просто генерация, а понимание физики и контекста реального мира.
Демо 1: Редактирование видео через диалог
Ключевая особенность Omni — редактирование видео с помощью естественного языка. Каждая следующая инструкция строится поверх предыдущей: персонажи остаются последовательными, физика не ломается, сцена «помнит» всё, что было раньше.
Пример промпта: «Сделай скульптуру из мыльных пузырей»
Результат: модель трансформирует материал объекта в пузыри, сохраняя форму, освещение и общую атмосферу сцены.
Демо 2: Переосмысление действия
Можно взять любое уже снятое видео и попросить Omni изменить происходящее: поменять действие, добавить новых персонажей или объекты, превратить обычный момент во что-то неожиданное.
Пример промпта: «Приглуши свет в комнате. Помести чёрно-белую комнату в шахматную клетку внутрь стеклянного шара, который парит над рукой, создавая бесконечную рекурсию. Камера медленно приближается к шару, создавая петлю».
Демо 3: Итеративное редактирование через несколько шагов
Процесс генерации разговорный: можно создать сцену, а затем текстовыми промптами менять угол камеры, стиль освещения или исправлять детали напрямую. Вот как выглядит цепочка редактирования одного видео:
| Шаг | Промпт | Что меняется |
|---|---|---|
| 1 | «Видео скрипача» | Исходная сцена |
| 2 | «Перенеси скрипача в другую среду» | Смена окружения |
| 3 | «Сделай скрипку невидимой» | Удаление объекта |
| 4 | «Смени угол камеры — вид из-за плеча» | Монтажная точка зрения |
Каждая правка учитывает предыдущую. Персонаж, его движения и логика сцены остаются неизменными.
graph TD
A[Исходное видео] --> B[Промпт 1: смена среды]
B --> C[Промпт 2: удаление объекта]
C --> D[Промпт 3: новый ракурс камеры]
D --> E[Итоговое видео]
style A fill:#4285F4,color:#fff
style E fill:#34A853,color:#fff
Gemini 3.5 Flash: скорость без компромиссов
Gemini 3.5 — новейшее семейство моделей, объединяющее передовой интеллект с возможностью действовать. Это значительный шаг вперёд в создании более способных и умных агентов.
Это сильнейшая агентная и кодинг-модель Google на сегодняшний день: она превосходит Gemini 3.1 Pro по ключевым бенчмаркам (Terminal-Bench 2.1: 76,2%; GDPval-AA: 1656 Elo; MCP Atlas: 83,6%) и лидирует в мультимодальном понимании (CharXiv: 84,2%). По скорости генерации токенов — в 4 раза быстрее других передовых моделей.
Демо 4: Агентные задачи в масштабе (Antigravity)
Gemini 3.5 Flash обеспечивает интеллект, сравнимый с большими флагманскими моделями по нескольким параметрам, при привычной для серии Flash скорости. В демонстрации, реализованной совместно с платформой Google Antigravity (агент-первая платформа разработки), модель автоматически переименовывает и категоризирует неструктурированные файлы на основе динамических критериев — без участия человека.
Демо 5: Совместные субагенты (Antigravity + 3.5 Flash)
Gemini 3.5 Flash превосходит Gemini 3.1 Pro по ключевым бенчмаркам и обеспечивает баланс производительности и скорости, идеальный для долгосрочных агентных задач, зачастую менее чем за половину стоимости сопоставимых моделей.
В сочетании с платформой Antigravity модель разворачивает несколько субагентов-коллаборантов, которые параллельно атакуют сложную проблему — от написания кода до структурирования данных.
Демо 6: Интерактивные веб-интерфейсы за 60 секунд
Опираясь на мощный мультимодальный фундамент Gemini 3, 3.5 Flash генерирует более богатые и интерактивные веб-интерфейсы и графику. В демо в AI Studio модель за 60 секунд создаёт несколько вариантов UX для страницы оформления заказа — от минималистичного до геймифицированного.
Gemini 3.5 Flash в повседневной жизни
3.5 Flash стал моделью по умолчанию для приложения Gemini и режима AI Mode в поиске Google по всему миру. Его агентные возможности питают новые функции, которые привносят интеллект уровня frontier в повседневную жизнь.
Демо 7: Информационные агенты в поиске Google
Улучшенные агентные возможности кодирования 3.5 Flash доставляют ещё более умные впечатления в поиске Google — например, новые информационные агенты. Работая в фоне 24/7, эти агенты интеллектуально анализируют информацию, чтобы найти именно то, что нужно, именно в нужный момент, и отправляют исчерпывающее обновление со ссылками для углублённого изучения.
Информационные агенты появятся сначала у подписчиков Google AI Pro и Ultra — этим летом.
Пример: Агент отслеживает анонсы коллабораций любимых спортсменов с брендами кроссовок и уведомляет пользователя в режиме реального времени.
Демо 8: Generative UI в поиске — визуализации «на лету»
Blagodarya платформе Antigravity и агентным возможностям Gemini 3.5 Flash, новые информационные агенты работают в фоне, чтобы держать вас в курсе важного. Google Search сможет создавать кастомные дашборды и трекеры для постоянных задач.
Пример из демо: Search строит интерактивную визуализацию, объясняющую геометрические паттерны Gyroid — структуры, встречающейся в природе и архитектуре.
Демо 9: Gemini Spark — персональный ИИ-агент
Gemini Spark — персональный ИИ-агент, работающий 24/7 и помогающий ориентироваться в вашей цифровой жизни, всё под вашим руководством.
Gemini Spark работает на Gemini 3.5 Flash и Antigravity. Он нативно подключается к вашим любимым приложениям Google: Gmail, Календарь, Drive, Docs, Таблицы, Презентации, YouTube и Google Карты.
Spark полностью добровольный: вы сами решаете, включать ли его и каким приложениям давать доступ. Помимо Workspace, он уже умеет работать с Canva, OpenTable и Instacart, список партнёров будет расширяться.
В демо агент самостоятельно составляет список снеков без орехов, а затем добавляет их в корзину Instacart — без единого клика от пользователя.
Сравнение моделей: Gemini Omni Flash vs Gemini 3.5 Flash
| Параметр | Gemini Omni Flash | Gemini 3.5 Flash |
|---|---|---|
| Основная задача | Создание и редактирование видео | Агентные задачи и кодирование |
| Входные данные | Текст, фото, аудио, видео | Текст, код, изображения |
| Выходные данные | Видео | Текст, код, UI, действия |
| Ключевая фишка | Конверсационное редактирование видео | Скорость в 4× быстрее конкурентов |
| Доступность (потребители) | Google AI Plus/Pro/Ultra, YouTube Shorts | Приложение Gemini, AI Mode в Search |
| Доступность (разработчики) | API — в ближайшие недели | Google AI Studio, Antigravity, Android Studio |
| Цена API (вход/выход) | Уточняется | $1,50 / $9,00 за млн токенов |
Доступность: кому и когда?
Gemini Omni Flash уже распространяется для всех подписчиков Google AI Plus, Pro и Ultra по всему миру через приложение Gemini и Google Flow. Для пользователей YouTube Shorts и приложения YouTube Create — бесплатно. Разработчики и корпоративные клиенты получат доступ через API в ближайшие недели.
Gemini 3.5 Flash уже доступен через Google Antigravity, Gemini API в Google AI Studio и Android Studio, Gemini Enterprise Agent Platform и Gemini Enterprise. Он также доступен для всех в режиме AI Mode в поиске и распространяется глобально в приложении Gemini.
Gemini Spark пока распространяется среди доверенных тестировщиков и будет доступен подписчикам Google AI Ultra в США.
Итог
Google I/O 2026 зафиксировал ключевой сдвиг: ИИ движется от пассивного чат-бота, отвечающего на вопросы, к активному партнёру, выполняющему многошаговые длительные задачи.
- Gemini Omni переосмысляет видеопроизводство — теперь для редактирования не нужен монтажёр, только правильный промпт.
- Gemini 3.5 Flash делает агентную автоматизацию доступной в масштабе — от личного поиска до корпоративных пайплайнов.
- Gemini Spark переводит ИИ-ассистента из режима «ответить» в режим «сделать».