Gemini в Google Sheets: ИИ достиг уровня эксперта
Google Gemini в Таблицах достиг 70,48% на бенчмарке SpreadsheetBench — близко к уровню человека-эксперта. Разбираем что это значит.
Google объявила, что Gemini в Google Sheets достиг лучшего результата среди всех ИИ-систем на бенчмарке SpreadsheetBench — публичном тесте, который оценивает способность моделей работать с реальными электронными таблицами. Результат — 70,48% успешных решений, что приближается к уровню человека-эксперта. Вместе с этим достижением компания запустила набор новых бета-функций, которые превращают ИИ из ассистента в полноценного соавтора при работе с таблицами.
Разбираемся, что стоит за этими цифрами, как устроен бенчмарк и что конкретно умеет обновлённый Gemini в Sheets.
Что такое SpreadsheetBench
SpreadsheetBench — это публичный бенчмарк для оценки способности ИИ-моделей манипулировать реальными электронными таблицами. Он был представлен исследователями из Университета Цинхуа и Университета Жэньминь и принят на NeurIPS 2024 (конференция по нейронным сетям и обработке информации) в секцию Datasets & Benchmarks.
Как устроен бенчмарк
SpreadsheetBench содержит:
- 912 инструкций — реальные запросы пользователей с онлайн-форумов Excel
- 2729 тестовых случаев — в среднем 3 теста на каждую задачу
- Сложные структуры данных — многотабличные макеты, нетекстовые элементы, нестандартные связи между данными
Система оценки напоминает онлайн-платформы для соревнований по программированию: решение проверяется на нескольких тестовых случаях, что позволяет оценить не только точность, но и обобщающую способность модели.
graph TD
A[912 реальных запросов
с форумов Excel] --> B[Реальные таблицы
со сложной структурой]
B --> C[ИИ-модель получает
задачу + файл]
C --> D[Модель генерирует
решение]
D --> E[Проверка на 2729
тестовых случаях]
E --> F{Результат}
F -->|Успех| G[Задача решена]
F -->|Провал| H[Задача не решена]
Результат Gemini: 70,48%
Google заявляет, что Gemini в Sheets достиг 70,48% на полном датасете SpreadsheetBench. Это первый случай, когда интегрированная в продукт ИИ-система (а не лабораторный прототип) показала такой результат на данном бенчмарке.
Gemini в Google Sheets не только превосходит конкурентов, но и приближается к способностям человека-эксперта.
— Google AI Blog
Важный контекст: речь идёт именно о первой версии SpreadsheetBench (V1). Существует и SpreadsheetBench V2, ориентированный на комплексные бизнес-сценарии — финансовое моделирование, отладку формул и визуализацию. На V2 результаты всех моделей значительно ниже, что говорит о пространстве для роста.
Сравнение с другими моделями
| Модель | SpreadsheetBench V1 | Примечание |
|---|---|---|
| Gemini в Sheets | 70,48% | Интегрирован в продукт |
| Предыдущие лидеры | ~50–60% | Лабораторные агенты |
| Человек-эксперт | ~80–85% | Опытные пользователи Excel |
Новые возможности Gemini в Google Sheets
Вместе с достижением на бенчмарке Google запустила набор бета-функций, доступных подписчикам Google AI Ultra и Google AI Pro.
Создание таблиц с нуля
Теперь можно описать задачу обычным языком, и Gemini сгенерирует полноценную таблицу. Модель умеет подтягивать данные из:
- Писем в Gmail — например, собрать все счета за квартал
- Файлов на Google Drive — структурировать данные из документов
- Веб-поиска Google — актуальные курсы валют, статистика, справочные данные
Fill with Gemini — заполнение с помощью ИИ
Функция «Fill with Gemini» (заполнение с помощью Gemini) позволяет мгновенно:
- Генерировать пользовательский текст в ячейках
- Категоризировать данные по заданным критериям
- Суммировать и агрегировать информацию
- Обращаться к поиску Google для получения актуальных данных
По данным Google, этот метод заполнения в 9 раз быстрее ручного ввода для задач на 100 ячеек.
Решение сложных аналитических задач
Gemini теперь справляется с задачами оптимизации, которые раньше требовали сложных формул или сторонних инструментов вроде Solver. Технология основана на исследованиях Google DeepMind и инструментах OR-Tools (библиотека Google для задач оптимизации и комбинаторики).
graph LR
A[Текстовый запрос
пользователя] --> B[Gemini анализирует
контекст]
B --> C{Тип задачи}
C -->|Создание| D[Генерация таблицы
с данными из Gmail,
Drive, веба]
C -->|Заполнение| E[Fill with Gemini —
категоризация,
суммирование]
C -->|Анализ| F[Оптимизация
и сложные формулы
через OR-Tools]
D --> G[Готовая таблица]
E --> G
F --> G
Практические сценарии использования
Рассмотрим, в каких задачах обновлённый Gemini может быть полезен уже сейчас.
Для малого бизнеса
- Бюджетирование: «Создай таблицу расходов за Q1 на основе счетов из почты»
- Учёт клиентов: «Собери контакты из последних 50 писем в таблицу и добавь статус сделки»
- Анализ продаж: «Построй сводку продаж по категориям и найди самый прибыльный сегмент»
Для аналитиков
- Очистка данных: заполнение пропусков, стандартизация форматов, категоризация
- Оптимизационные задачи: распределение ресурсов, логистика, планирование графиков
- Быстрые дашборды: описание нужной визуализации на естественном языке
Для повседневных задач
- Планирование путешествий с автоматическим подтягиванием цен
- Сравнительные таблицы товаров на основе веб-данных
- Учёт домашнего бюджета с категоризацией расходов
«Создай таблицу для сравнения трёх облачных провайдеров: AWS, Google Cloud и Azure. Включи цены на базовые инстансы, доступные регионы в России и рейтинг на G2. Данные возьми из веба.»
Gemini сгенерирует таблицу, подтянет актуальные данные из поиска и структурирует их в готовом для анализа виде.
Доступность и ограничения
| Параметр | Детали |
|---|---|
| Статус | Бета-версия |
| Подписки | Google AI Ultra, Google AI Pro |
| Язык | Английский (глобально) |
| Платформа | Google Sheets (веб) |
| Другие продукты | Аналогичные обновления для Docs, Slides, Drive |
Что это значит для рынка
Достижение Google важно по нескольким причинам:
1. ИИ переходит от ассистента к исполнителю. Раньше ИИ в таблицах мог подсказать формулу или ответить на вопрос по данным. Теперь он создаёт, заполняет и анализирует целые таблицы автономно.
2. Бенчмарк как маркетинговый инструмент. Google первой из крупных компаний привязала результаты коммерческого продукта к академическому бенчмарку в области таблиц. Это задаёт стандарт, к которому будут стремиться Microsoft Copilot и другие.
3. Интеграция с экосистемой — главное преимущество. Доступ к Gmail, Drive и веб-поиску даёт Gemini в Sheets контекст, которого нет у автономных моделей. Именно это, вероятно, объясняет разрыв в результатах.
Будущее работы с данными — не в том, чтобы учить людей сложным формулам, а в том, чтобы позволить им описывать задачу словами.
Выводы
Gemini в Google Sheets показал впечатляющий результат на SpreadsheetBench — 70,48% против ~50–60% у предыдущих лидеров. Новые бета-функции (создание таблиц из описания, Fill with Gemini, решение оптимизационных задач) доступны подписчикам Google AI Ultra и Pro.
Для русскоязычных пользователей пока есть ограничение по языку — функции работают только на английском. Но сам тренд очевиден: работа с электронными таблицами будет становиться всё более «разговорной», и порог входа для сложного анализа данных продолжит снижаться.
- Убедитесь, что у вас подписка Google AI Ultra или Google AI Pro
- Откройте Google Sheets
- Используйте боковую панель Gemini для описания задачи на английском языке
- Попробуйте функцию Fill with Gemini для быстрого заполнения данных