9 демо Gemini Omni и Gemini 3.5: что умеют новые модели Google

На конференции Google I/O 2026 компания представила сразу два семейства моделей, каждое из которых решает принципиально разные задачи. С Gemini Omni способность рассуждать встречается со способностью создавать, а Gemini 3.5 создан для выполнения сложных агентных рабочих процессов.

«С мировыми моделями ИИ переходит от предсказания текста к симуляции реальности. Gemini Omni — следующий шаг в этом направлении». — Сундар Пичаи, CEO Google

Чтобы разобраться, на что способны новые инструменты, Google опубликовал девять демонстрационных роликов. Ниже — подробный разбор каждого.


Gemini Omni: когда видео редактируется разговором

Gemini Omni — принципиально новая модель, которая создаёт динамичный видеоконтент, объединяя текстовые, аудио-, изображённые и видеовходы. Главная её особенность — не просто генерация, а понимание физики и контекста реального мира.

ℹ Что такое Gemini Omni?
Gemini Omni — это «мировая модель» (world model), способная принимать на вход текст, изображения, аудио и видео одновременно, а затем генерировать видео, основанное на реальных знаниях о мире. В отличие от стандартных видеогенераторов, она понимает физику, освещение и пространственные отношения между объектами.

Демо 1: Редактирование видео через диалог

Ключевая особенность Omni — редактирование видео с помощью естественного языка. Каждая следующая инструкция строится поверх предыдущей: персонажи остаются последовательными, физика не ломается, сцена «помнит» всё, что было раньше.

Пример промпта: «Сделай скульптуру из мыльных пузырей»

Результат: модель трансформирует материал объекта в пузыри, сохраняя форму, освещение и общую атмосферу сцены.

Демо 2: Переосмысление действия

Можно взять любое уже снятое видео и попросить Omni изменить происходящее: поменять действие, добавить новых персонажей или объекты, превратить обычный момент во что-то неожиданное.

Пример промпта: «Приглуши свет в комнате. Помести чёрно-белую комнату в шахматную клетку внутрь стеклянного шара, который парит над рукой, создавая бесконечную рекурсию. Камера медленно приближается к шару, создавая петлю».

📝 Практический кейс
Представьте, что вы сняли обычный промо-ролик для своего продукта. С Gemini Omni можно одним текстовым запросом поместить его в любую среду — арктический пейзаж, лунный кратер или студию в стиле 80-х — без пересъёмки.

Демо 3: Итеративное редактирование через несколько шагов

Процесс генерации разговорный: можно создать сцену, а затем текстовыми промптами менять угол камеры, стиль освещения или исправлять детали напрямую. Вот как выглядит цепочка редактирования одного видео:

ШагПромптЧто меняется
1«Видео скрипача»Исходная сцена
2«Перенеси скрипача в другую среду»Смена окружения
3«Сделай скрипку невидимой»Удаление объекта
4«Смени угол камеры — вид из-за плеча»Монтажная точка зрения

Каждая правка учитывает предыдущую. Персонаж, его движения и логика сцены остаются неизменными.


graph TD
    A[Исходное видео] --> B[Промпт 1: смена среды]
    B --> C[Промпт 2: удаление объекта]
    C --> D[Промпт 3: новый ракурс камеры]
    D --> E[Итоговое видео]
    style A fill:#4285F4,color:#fff
    style E fill:#34A853,color:#fff


Gemini 3.5 Flash: скорость без компромиссов

Gemini 3.5 — новейшее семейство моделей, объединяющее передовой интеллект с возможностью действовать. Это значительный шаг вперёд в создании более способных и умных агентов.

Это сильнейшая агентная и кодинг-модель Google на сегодняшний день: она превосходит Gemini 3.1 Pro по ключевым бенчмаркам (Terminal-Bench 2.1: 76,2%; GDPval-AA: 1656 Elo; MCP Atlas: 83,6%) и лидирует в мультимодальном понимании (CharXiv: 84,2%). По скорости генерации токенов — в 4 раза быстрее других передовых моделей.

💡 Сколько стоит Gemini 3.5 Flash для разработчиков?
По данным Google, стоимость Gemini 3.5 Flash составляет $1,50 за миллион входных токенов и $9,00 за миллион выходных — при этом модель часто оказывается вдвое дешевле сопоставимых решений конкурентов.

Демо 4: Агентные задачи в масштабе (Antigravity)

Gemini 3.5 Flash обеспечивает интеллект, сравнимый с большими флагманскими моделями по нескольким параметрам, при привычной для серии Flash скорости. В демонстрации, реализованной совместно с платформой Google Antigravity (агент-первая платформа разработки), модель автоматически переименовывает и категоризирует неструктурированные файлы на основе динамических критериев — без участия человека.

Демо 5: Совместные субагенты (Antigravity + 3.5 Flash)

Gemini 3.5 Flash превосходит Gemini 3.1 Pro по ключевым бенчмаркам и обеспечивает баланс производительности и скорости, идеальный для долгосрочных агентных задач, зачастую менее чем за половину стоимости сопоставимых моделей.

В сочетании с платформой Antigravity модель разворачивает несколько субагентов-коллаборантов, которые параллельно атакуют сложную проблему — от написания кода до структурирования данных.

Демо 6: Интерактивные веб-интерфейсы за 60 секунд

Опираясь на мощный мультимодальный фундамент Gemini 3, 3.5 Flash генерирует более богатые и интерактивные веб-интерфейсы и графику. В демо в AI Studio модель за 60 секунд создаёт несколько вариантов UX для страницы оформления заказа — от минималистичного до геймифицированного.


Gemini 3.5 Flash в повседневной жизни

3.5 Flash стал моделью по умолчанию для приложения Gemini и режима AI Mode в поиске Google по всему миру. Его агентные возможности питают новые функции, которые привносят интеллект уровня frontier в повседневную жизнь.

Демо 7: Информационные агенты в поиске Google

Улучшенные агентные возможности кодирования 3.5 Flash доставляют ещё более умные впечатления в поиске Google — например, новые информационные агенты. Работая в фоне 24/7, эти агенты интеллектуально анализируют информацию, чтобы найти именно то, что нужно, именно в нужный момент, и отправляют исчерпывающее обновление со ссылками для углублённого изучения.

Информационные агенты появятся сначала у подписчиков Google AI Pro и Ultra — этим летом.

Пример: Агент отслеживает анонсы коллабораций любимых спортсменов с брендами кроссовок и уведомляет пользователя в режиме реального времени.

Демо 8: Generative UI в поиске — визуализации «на лету»

Blagodarya платформе Antigravity и агентным возможностям Gemini 3.5 Flash, новые информационные агенты работают в фоне, чтобы держать вас в курсе важного. Google Search сможет создавать кастомные дашборды и трекеры для постоянных задач.

Пример из демо: Search строит интерактивную визуализацию, объясняющую геометрические паттерны Gyroid — структуры, встречающейся в природе и архитектуре.

💡 Generative UI — что это?
Generative UI (генеративный пользовательский интерфейс) — подход, при котором ИИ создаёт не просто текстовый ответ, а полноценный интерактивный интерфейс: симуляции, трекеры, мини-приложения — строго под конкретный запрос. Google обещает открыть эту функцию для всех пользователей Search бесплатно этим летом.

Демо 9: Gemini Spark — персональный ИИ-агент

Gemini Spark — персональный ИИ-агент, работающий 24/7 и помогающий ориентироваться в вашей цифровой жизни, всё под вашим руководством.

Gemini Spark работает на Gemini 3.5 Flash и Antigravity. Он нативно подключается к вашим любимым приложениям Google: Gmail, Календарь, Drive, Docs, Таблицы, Презентации, YouTube и Google Карты.

Spark полностью добровольный: вы сами решаете, включать ли его и каким приложениям давать доступ. Помимо Workspace, он уже умеет работать с Canva, OpenTable и Instacart, список партнёров будет расширяться.

В демо агент самостоятельно составляет список снеков без орехов, а затем добавляет их в корзину Instacart — без единого клика от пользователя.

⚠ Важно: конфиденциальность и контроль
Google заверяет, что Spark будет спрашивать разрешения перед выполнением «действий с высокими ставками» — трат денег или отправки писем. Тем не менее стоит внимательно настраивать, к каким данным агент имеет доступ.

Сравнение моделей: Gemini Omni Flash vs Gemini 3.5 Flash

ПараметрGemini Omni FlashGemini 3.5 Flash
Основная задачаСоздание и редактирование видеоАгентные задачи и кодирование
Входные данныеТекст, фото, аудио, видеоТекст, код, изображения
Выходные данныеВидеоТекст, код, UI, действия
Ключевая фишкаКонверсационное редактирование видеоСкорость в 4× быстрее конкурентов
Доступность (потребители)Google AI Plus/Pro/Ultra, YouTube ShortsПриложение Gemini, AI Mode в Search
Доступность (разработчики)API — в ближайшие неделиGoogle AI Studio, Antigravity, Android Studio
Цена API (вход/выход)Уточняется$1,50 / $9,00 за млн токенов

Доступность: кому и когда?

Gemini Omni Flash уже распространяется для всех подписчиков Google AI Plus, Pro и Ultra по всему миру через приложение Gemini и Google Flow. Для пользователей YouTube Shorts и приложения YouTube Create — бесплатно. Разработчики и корпоративные клиенты получат доступ через API в ближайшие недели.

Gemini 3.5 Flash уже доступен через Google Antigravity, Gemini API в Google AI Studio и Android Studio, Gemini Enterprise Agent Platform и Gemini Enterprise. Он также доступен для всех в режиме AI Mode в поиске и распространяется глобально в приложении Gemini.

Gemini Spark пока распространяется среди доверенных тестировщиков и будет доступен подписчикам Google AI Ultra в США.


Итог

Google I/O 2026 зафиксировал ключевой сдвиг: ИИ движется от пассивного чат-бота, отвечающего на вопросы, к активному партнёру, выполняющему многошаговые длительные задачи.

  • Gemini Omni переосмысляет видеопроизводство — теперь для редактирования не нужен монтажёр, только правильный промпт.
  • Gemini 3.5 Flash делает агентную автоматизацию доступной в масштабе — от личного поиска до корпоративных пайплайнов.
  • Gemini Spark переводит ИИ-ассистента из режима «ответить» в режим «сделать».
💡 Попробовать прямо сейчас
Gemini 3.5 Flash доступен в Google AI Studio (ai.google.dev) бесплатно в рамках квот. Gemini Omni Flash — в приложении Gemini для подписчиков Plus и выше. Если вы разработчик — следите за API-доступом: он откроется в ближайшие недели.