Как автоматизировать конвейер ChatGPT → Gemini для генерации изображений
Пользователь n8n ищет способ масштабировать пайплайн ChatGPT → Gemini Nano Banana Pro для пакетной генерации изображений. Разбираем решения и инструменты.
В сообществе r/n8n на Reddit набирает обсуждение практическая проблема: пользователь выстроил трёхшаговый конвейер генерации изображений с ChatGPT и Gemini, но не может его масштабировать — всё делается вручную, по одному запросу. Ситуация отражает типичный bottleneck в AI-воркфлоу: автоматизировать каждый шаг по отдельности легко, но состыковать их в пакетный пайплайн — уже задача.
Как устроен проблемный воркфлоу
Автор описывает трёхэтапный процесс:
- Шаг 1 — ChatGPT генерирует детальные промпты для изображений
- Шаг 2 — Gemini Nano Banana Pro (gemini-3-pro-image-preview) создаёт изображения по этим промптам
- Шаг 3 — ручная доработка в Photoshop: выравнивание стиля, исправление артефактов, финальный контроль качества
Шаги 1 и 2 выполняются последовательно вручную, по одному. Третий шаг намеренно оставлен ручным — контроль качества здесь критичен.
graph LR
A[Список задач] --> B[ChatGPT\nгенерирует промпты]
B --> C[Gemini Nano Banana Pro\nгенерирует изображения]
C --> D[Photoshop\nручная доработка]
D --> E[Готовый результат]
style D fill:#f9f,stroke:#333
Где конкретно теряется время
Проблема не в самих API — они быстрые. Проблема в том, что пользователь запускает каждый запрос вручную: сгенерировал промпт → скопировал → вставил в Gemini → сохранил изображение → повторил. При десятках задач это часы работы.
Шаги 1 и 2 слишком трудоёмки, потому что я делаю всё по одному. Мне нужен способ автоматизировать их без потери качества.
Что реально решает задачу
Сообщество n8n — это именно то место, где такой вопрос задают, потому что n8n предоставляет готовые блоки для обоих шагов. Несколько рабочих подходов:
Вариант 1: Google Sheets как очередь задач
В библиотеке шаблонов n8n уже есть готовый воркфлоу: таблица Google Sheets содержит список тем или заготовок, триггер по расписанию подхватывает записи со статусом pending, генерирует промпты через Gemini (или ChatGPT), создаёт изображения и сохраняет в Google Drive. Статус записи обновляется на done.
Вариант 2: Split In Batches + параллельные запросы
n8n поддерживает узел Split In Batches — он разбивает массив задач на порции (например, по 10) и обрабатывает их последовательно, соблюдая rate limits API. Это позволяет запустить пакет из 50–100 изображений без ручного вмешательства.
Вариант 3: Webhooks и очередь
Если нужна интеграция с внешними системами (Airtable, Notion, Telegram-бот), воркфлоу можно запускать через webhook — задания прилетают из любого источника.
Сравнение моделей для пайплайна
| Модель | Цена/изображение | Качество | Скорость | Rate limit |
|---|---|---|---|---|
| Gemini Nano Banana Pro (gemini-3-pro-image-preview) | ~$0.134 | Высокое | Среднее | Есть |
| Gemini 2.0 Flash Image | ~$0.039 | Хорошее | Быстрое | Есть |
| Imagen 3 | ~$0.030 | Высокое | Среднее | Есть |
| GPT-image-1 (OpenAI) | ~$0.040–0.120 | Высокое | Среднее | Есть |
Почему это важно для отрасли
Запрос на Reddit — не единичный случай, а симптом. По мере того как AI-инструменты дешевеют и становятся доступнее, всё больше людей выстраивают «полуручные» воркфлоу: часть этапов автоматизирована, часть требует человека. Следующий шаг — автоматизировать промежуточные этапы, оставив человеку только финальный контроль.
n8n здесь выступает как связующий слой: он не заменяет ChatGPT или Gemini, но убирает ручную работу между ними. Платформа поддерживает более 400 интеграций и позволяет выстраивать пакетные пайплайны без написания кода — что критично для дизайнеров и маркетологов, которые не являются разработчиками.
Растущий запрос на такие решения подталкивает и сами AI-платформы: Google уже выпустил шаблоны n8n для Gemini + Google Sheets + Drive, а OpenAI — для GPT-image-1 с хранением в Google Drive и трекингом стоимости.