Как автоматизировать конвейер ChatGPT → Gemini для генерации изображений

В сообществе r/n8n на Reddit набирает обсуждение практическая проблема: пользователь выстроил трёхшаговый конвейер генерации изображений с ChatGPT и Gemini, но не может его масштабировать — всё делается вручную, по одному запросу. Ситуация отражает типичный bottleneck в AI-воркфлоу: автоматизировать каждый шаг по отдельности легко, но состыковать их в пакетный пайплайн — уже задача.

Как устроен проблемный воркфлоу

Автор описывает трёхэтапный процесс:

Шаг 1 — ChatGPT генерирует детальные промпты для изображений
Шаг 2 — Gemini Nano Banana Pro (gemini-3-pro-image-preview) создаёт изображения по этим промптам
Шаг 3 — ручная доработка в Photoshop: выравнивание стиля, исправление артефактов, финальный контроль качества

Шаги 1 и 2 выполняются последовательно вручную, по одному. Третий шаг намеренно оставлен ручным — контроль качества здесь критичен.

ℹ Gemini Nano Banana Pro

Nano Banana Pro — внутреннее кодовое имя модели gemini-3-pro-image-preview в Gemini API. Стоимость: от $0.134 за изображение. Для сравнения, Imagen 3 обходится в $0.03/изображение, а Gemini 2.0 Flash Image — около $0.039/изображение.


graph LR
    A[Список задач] --> B[ChatGPT\nгенерирует промпты]
    B --> C[Gemini Nano Banana Pro\nгенерирует изображения]
    C --> D[Photoshop\nручная доработка]
    D --> E[Готовый результат]
    style D fill:#f9f,stroke:#333

Где конкретно теряется время

Проблема не в самих API — они быстрые. Проблема в том, что пользователь запускает каждый запрос вручную: сгенерировал промпт → скопировал → вставил в Gemini → сохранил изображение → повторил. При десятках задач это часы работы.

Шаги 1 и 2 слишком трудоёмки, потому что я делаю всё по одному. Мне нужен способ автоматизировать их без потери качества.

Что реально решает задачу

Сообщество n8n — это именно то место, где такой вопрос задают, потому что n8n предоставляет готовые блоки для обоих шагов. Несколько рабочих подходов:

Вариант 1: Google Sheets как очередь задач

В библиотеке шаблонов n8n уже есть готовый воркфлоу: таблица Google Sheets содержит список тем или заготовок, триггер по расписанию подхватывает записи со статусом pending, генерирует промпты через Gemini (или ChatGPT), создаёт изображения и сохраняет в Google Drive. Статус записи обновляется на done.

Вариант 2: Split In Batches + параллельные запросы

n8n поддерживает узел Split In Batches — он разбивает массив задач на порции (например, по 10) и обрабатывает их последовательно, соблюдая rate limits API. Это позволяет запустить пакет из 50–100 изображений без ручного вмешательства.

Вариант 3: Webhooks и очередь

Если нужна интеграция с внешними системами (Airtable, Notion, Telegram-бот), воркфлоу можно запускать через webhook — задания прилетают из любого источника.

💡 Rate limits — главная ловушка

Gemini API ограничивает количество запросов в минуту. При пакетной обработке обязательно добавляйте паузы между запросами (узел Wait в n8n) или используйте экспоненциальный backoff при ошибках 429.

Сравнение моделей для пайплайна

Модель	Цена/изображение	Качество	Скорость	Rate limit
Gemini Nano Banana Pro (gemini-3-pro-image-preview)	~$0.134	Высокое	Среднее	Есть
Gemini 2.0 Flash Image	~$0.039	Хорошее	Быстрое	Есть
Imagen 3	~$0.030	Высокое	Среднее	Есть
GPT-image-1 (OpenAI)	~$0.040–0.120	Высокое	Среднее	Есть

⚠ Проверяйте актуальные лимиты

Цены и rate limits на Gemini API меняются. Перед запуском пакетного пайплайна сверяйтесь с официальной документацией Google AI for Developers — особенно для preview-моделей, которые могут быть отозваны или переименованы.

Почему это важно для отрасли

Запрос на Reddit — не единичный случай, а симптом. По мере того как AI-инструменты дешевеют и становятся доступнее, всё больше людей выстраивают «полуручные» воркфлоу: часть этапов автоматизирована, часть требует человека. Следующий шаг — автоматизировать промежуточные этапы, оставив человеку только финальный контроль.

n8n здесь выступает как связующий слой: он не заменяет ChatGPT или Gemini, но убирает ручную работу между ними. Платформа поддерживает более 400 интеграций и позволяет выстраивать пакетные пайплайны без написания кода — что критично для дизайнеров и маркетологов, которые не являются разработчиками.

Растущий запрос на такие решения подталкивает и сами AI-платформы: Google уже выпустил шаблоны n8n для Gemini + Google Sheets + Drive, а OpenAI — для GPT-image-1 с хранением в Google Drive и трекингом стоимости.

Как устроен проблемный воркфлоу

Где конкретно теряется время

Что реально решает задачу

Вариант 1: Google Sheets как очередь задач

Вариант 2: Split In Batches + параллельные запросы

Вариант 3: Webhooks и очередь

Сравнение моделей для пайплайна

Почему это важно для отрасли

Источники

Похожие статьи

ChatGPT vs Gemini: один промпт — два разных мира

ChatGPT рисует киберпанк 1950-х, Gemini оживляет

n8n-MCP: ИИ-ассистент строит n8n-воркфлоу за вас

Нестабильные API в n8n: как не сломать воркфлоу

MCP-сервер для n8n: генерация и валидация JSON воркфлоу