Google объявила, что Gemini в Google Sheets достиг лучшего результата среди всех ИИ-систем на бенчмарке SpreadsheetBench — публичном тесте, который оценивает способность моделей работать с реальными электронными таблицами. Результат — 70,48% успешных решений, что приближается к уровню человека-эксперта. Вместе с этим достижением компания запустила набор новых бета-функций, которые превращают ИИ из ассистента в полноценного соавтора при работе с таблицами.

Разбираемся, что стоит за этими цифрами, как устроен бенчмарк и что конкретно умеет обновлённый Gemini в Sheets.

Что такое SpreadsheetBench

SpreadsheetBench — это публичный бенчмарк для оценки способности ИИ-моделей манипулировать реальными электронными таблицами. Он был представлен исследователями из Университета Цинхуа и Университета Жэньминь и принят на NeurIPS 2024 (конференция по нейронным сетям и обработке информации) в секцию Datasets & Benchmarks.

ℹ Почему этот бенчмарк важен
В отличие от синтетических тестов, SpreadsheetBench построен на 912 реальных задачах, собранных с форумов, где пользователи Excel просят помощи. Это не учебные примеры — это запутанные таблицы с несколькими листами, нестандартной структурой и реальными бизнес-данными.

Как устроен бенчмарк

SpreadsheetBench содержит:

  • 912 инструкций — реальные запросы пользователей с онлайн-форумов Excel
  • 2729 тестовых случаев — в среднем 3 теста на каждую задачу
  • Сложные структуры данных — многотабличные макеты, нетекстовые элементы, нестандартные связи между данными

Система оценки напоминает онлайн-платформы для соревнований по программированию: решение проверяется на нескольких тестовых случаях, что позволяет оценить не только точность, но и обобщающую способность модели.


graph TD
    A[912 реальных запросов
с форумов Excel] --> B[Реальные таблицы
со сложной структурой] B --> C[ИИ-модель получает
задачу + файл] C --> D[Модель генерирует
решение] D --> E[Проверка на 2729
тестовых случаях] E --> F{Результат} F -->|Успех| G[Задача решена] F -->|Провал| H[Задача не решена]

Результат Gemini: 70,48%

Google заявляет, что Gemini в Sheets достиг 70,48% на полном датасете SpreadsheetBench. Это первый случай, когда интегрированная в продукт ИИ-система (а не лабораторный прототип) показала такой результат на данном бенчмарке.

Gemini в Google Sheets не только превосходит конкурентов, но и приближается к способностям человека-эксперта.
Google AI Blog

Важный контекст: речь идёт именно о первой версии SpreadsheetBench (V1). Существует и SpreadsheetBench V2, ориентированный на комплексные бизнес-сценарии — финансовое моделирование, отладку формул и визуализацию. На V2 результаты всех моделей значительно ниже, что говорит о пространстве для роста.

Сравнение с другими моделями

МодельSpreadsheetBench V1Примечание
Gemini в Sheets70,48%Интегрирован в продукт
Предыдущие лидеры~50–60%Лабораторные агенты
Человек-эксперт~80–85%Опытные пользователи Excel
⚠ О бенчмарках
Бенчмарки показывают производительность в контролируемых условиях. Реальная работа с таблицами включает нечётко сформулированные задачи, неполные данные и контекст, который сложно передать модели. Результат 70,48% впечатляет, но не означает, что ИИ заменит эксперта во всех сценариях.

Новые возможности Gemini в Google Sheets

Вместе с достижением на бенчмарке Google запустила набор бета-функций, доступных подписчикам Google AI Ultra и Google AI Pro.

Создание таблиц с нуля

Теперь можно описать задачу обычным языком, и Gemini сгенерирует полноценную таблицу. Модель умеет подтягивать данные из:

  • Писем в Gmail — например, собрать все счета за квартал
  • Файлов на Google Drive — структурировать данные из документов
  • Веб-поиска Google — актуальные курсы валют, статистика, справочные данные

Fill with Gemini — заполнение с помощью ИИ

Функция «Fill with Gemini» (заполнение с помощью Gemini) позволяет мгновенно:

  • Генерировать пользовательский текст в ячейках
  • Категоризировать данные по заданным критериям
  • Суммировать и агрегировать информацию
  • Обращаться к поиску Google для получения актуальных данных

По данным Google, этот метод заполнения в 9 раз быстрее ручного ввода для задач на 100 ячеек.

Решение сложных аналитических задач

Gemini теперь справляется с задачами оптимизации, которые раньше требовали сложных формул или сторонних инструментов вроде Solver. Технология основана на исследованиях Google DeepMind и инструментах OR-Tools (библиотека Google для задач оптимизации и комбинаторики).


graph LR
    A[Текстовый запрос
пользователя] --> B[Gemini анализирует
контекст] B --> C{Тип задачи} C -->|Создание| D[Генерация таблицы
с данными из Gmail,
Drive, веба] C -->|Заполнение| E[Fill with Gemini —
категоризация,
суммирование] C -->|Анализ| F[Оптимизация
и сложные формулы
через OR-Tools] D --> G[Готовая таблица] E --> G F --> G

Практические сценарии использования

Рассмотрим, в каких задачах обновлённый Gemini может быть полезен уже сейчас.

Для малого бизнеса

  • Бюджетирование: «Создай таблицу расходов за Q1 на основе счетов из почты»
  • Учёт клиентов: «Собери контакты из последних 50 писем в таблицу и добавь статус сделки»
  • Анализ продаж: «Построй сводку продаж по категориям и найди самый прибыльный сегмент»

Для аналитиков

  • Очистка данных: заполнение пропусков, стандартизация форматов, категоризация
  • Оптимизационные задачи: распределение ресурсов, логистика, планирование графиков
  • Быстрые дашборды: описание нужной визуализации на естественном языке

Для повседневных задач

  • Планирование путешествий с автоматическим подтягиванием цен
  • Сравнительные таблицы товаров на основе веб-данных
  • Учёт домашнего бюджета с категоризацией расходов
📝 Пример запроса

«Создай таблицу для сравнения трёх облачных провайдеров: AWS, Google Cloud и Azure. Включи цены на базовые инстансы, доступные регионы в России и рейтинг на G2. Данные возьми из веба.»

Gemini сгенерирует таблицу, подтянет актуальные данные из поиска и структурирует их в готовом для анализа виде.

Доступность и ограничения

ПараметрДетали
СтатусБета-версия
ПодпискиGoogle AI Ultra, Google AI Pro
ЯзыкАнглийский (глобально)
ПлатформаGoogle Sheets (веб)
Другие продуктыАналогичные обновления для Docs, Slides, Drive
⚠ Для русскоязычных пользователей
На момент запуска новые функции доступны только на английском языке. Для русскоязычных пользователей это означает, что запросы к Gemini в Sheets нужно формулировать на английском. Когда Google добавит поддержку русского — пока не объявлено.

Что это значит для рынка

Достижение Google важно по нескольким причинам:

1. ИИ переходит от ассистента к исполнителю. Раньше ИИ в таблицах мог подсказать формулу или ответить на вопрос по данным. Теперь он создаёт, заполняет и анализирует целые таблицы автономно.

2. Бенчмарк как маркетинговый инструмент. Google первой из крупных компаний привязала результаты коммерческого продукта к академическому бенчмарку в области таблиц. Это задаёт стандарт, к которому будут стремиться Microsoft Copilot и другие.

3. Интеграция с экосистемой — главное преимущество. Доступ к Gmail, Drive и веб-поиску даёт Gemini в Sheets контекст, которого нет у автономных моделей. Именно это, вероятно, объясняет разрыв в результатах.

Будущее работы с данными — не в том, чтобы учить людей сложным формулам, а в том, чтобы позволить им описывать задачу словами.

Выводы

Gemini в Google Sheets показал впечатляющий результат на SpreadsheetBench — 70,48% против ~50–60% у предыдущих лидеров. Новые бета-функции (создание таблиц из описания, Fill with Gemini, решение оптимизационных задач) доступны подписчикам Google AI Ultra и Pro.

Для русскоязычных пользователей пока есть ограничение по языку — функции работают только на английском. Но сам тренд очевиден: работа с электронными таблицами будет становиться всё более «разговорной», и порог входа для сложного анализа данных продолжит снижаться.

💡 Как попробовать
  1. Убедитесь, что у вас подписка Google AI Ultra или Google AI Pro
  2. Откройте Google Sheets
  3. Используйте боковую панель Gemini для описания задачи на английском языке
  4. Попробуйте функцию Fill with Gemini для быстрого заполнения данных