Fooocus: генерация изображений без лишних настроек
Обзор Fooocus — бесплатного open-source инструмента для генерации изображений на базе SDXL. Просто, как Midjourney, но локально и бесплатно.
Fooocus: генерация изображений без лишних настроек
«Используй Fooocus так же легко, как Midjourney — но это офлайн, с открытым кодом и абсолютно бесплатно.»
Что такое Fooocus и для кого он создан
Fooocus — это open-source программа для генерации изображений по текстовому промпту, использующая Stable Diffusion XL (SDXL) в качестве базовой модели, дополненная набором оптимизированных настроек по умолчанию для максимально удобного процесса.
Fooocus предлагает переосмысление подхода к дизайну генераторов изображений: инструмент работает офлайн, является open-source и полностью бесплатным, при этом — подобно популярным облачным сервисам вроде Midjourney — не требует ручной настройки параметров. Пользователи могут сосредоточиться исключительно на промптах и результатах.
Fooocus создан Лвмином Чжаном (Lvmin Zhang) — докторантом Стэнфордского университета, который также является главным автором ControlNet — технологии, принятой на вооружение многими другими интерфейсами Stable Diffusion, включая AUTOMATIC1111 и ComfyUI.
Проект ориентирован на широкую аудиторию:
- Новички, впервые знакомящиеся с AI-генерацией изображений
- Художники и дизайнеры, которым нужен быстрый результат без погружения в технические детали
- Пользователи Midjourney, желающие перейти на локальное и бесплатное решение
- Энтузиасты SDXL, ценящие качество «из коробки»
Ключевые возможности
1. Умная обработка промптов на базе GPT-2
Fooocus обеспечивает высококачественную генерацию текст-в-изображение без необходимости тщательного prompt-инжиниринга или ручной настройки параметров. Для этого используется офлайн-движок обработки промптов на базе GPT-2, который гарантирует красивый результат независимо от того, насколько короток или длинен ваш промпт — будь то «дом в саду» или тысяча слов.
Пример: введите cyberpunk city at night — Fooocus автоматически расширит промпт, подберёт стили и сэмплинг, выдав профессионально выглядящий результат.
2. Три пресета запуска
Fooocus поставляется с несколькими лаунчерами: run.bat, run_anime.bat и run_realistic.bat. Каждый из них соответствует отдельному пресету модели (Default, Anime, Realistic), которые автоматически скачиваются при первом запуске.
# Запуск стандартного пресета
python entry_with_update.py
# Запуск аниме-пресета
python entry_with_update.py --preset anime
# Запуск реалистичного пресета
python entry_with_update.py --preset realistic
3. Inpaint и Outpaint
Функции Inpaint и Outpaint в Fooocus позволяют изменять конкретные области изображения без необходимости перегенерировать его целиком, обеспечивая точный контроль над деталями.
Для Inpaint/Outpaint Fooocus использует собственный алгоритм и собственные модели, что обеспечивает результат более высокого качества по сравнению со стандартными методами SDXL.
- Inpaint — закрасьте маской нужную область и опишите, что должно появиться вместо неё
- Outpaint — расширьте холст в любом направлении (вверх, вниз, влево, вправо)
- Improve Detail — автоматически улучшает лица, руки, глаза
4. Image Prompt (аналог IP-Adapter)
Fooocus использует собственный алгоритм Image Prompt, обеспечивающий более высокое качество и понимание промпта по сравнению с другими инструментами, использующими стандартные методы SDXL, такие как IP-Adapters или Revisions.
5. Поддержка LoRA
Fooocus поддерживает LoRA, что позволяет легко добавлять разнообразные художественные стили. Прямо во вкладке Models можно выбрать LoRA-модели, например «Film Photography», а также накладывать несколько LoRA одновременно. Поддерживается одновременное использование до 5 LoRA, которые объединяются для генерации финального изображения.
6. Расширенные параметры (Advanced-вкладка)
Fooocus автоматически применяет лучшую конфигурацию по умолчанию, чтобы пользователи могли сосредоточиться на промптах, игнорируя технические параметры. Тем не менее для продвинутых пользователей предусмотрен широкий набор дополнительных настроек.
Во вкладке Advanced доступны: разрешение, стили, модели, LoRA и параметры guidance.
7. Минимальные требования и простая установка
Fooocus максимально упростил установку: от нажатия кнопки «скачать» до генерации первого изображения требуется не более 3 кликов мышью. Минимальный объём видеопамяти — 4 ГБ (Nvidia).
Поддерживается локальное развёртывание и офлайн-использование при минимальных требованиях: 8 ГБ ОЗУ и видеокарта Nvidia с 4 ГБ VRAM.
Как работает Fooocus: схема процесса
graph TD
A[Вводите промпт] --> B[GPT-2 расширяет промпт]
B --> C[Выбор пресета: Default / Anime / Realistic]
C --> D[SDXL Base Model]
D --> E[SDXL Refiner]
E --> F{Дополнительные опции?}
F -- Нет --> G[Готовое изображение]
F -- Inpaint/Outpaint --> H[Редактирование зон]
F -- LoRA --> I[Применение стиля]
F -- Image Prompt --> J[Перенос визуального стиля]
H --> G
I --> G
J --> G
Тарифы и цены
Fooocus является полностью бесплатным и open-source инструментом. Лицензия — GNU GPL v3.0.
| Вариант использования | Стоимость |
|---|---|
| Локальная установка (Windows/Linux/macOS) | Бесплатно |
| Google Colab (бесплатный тир) | Бесплатно |
| Исходный код на GitHub | Открытый (GPL v3) |
| Облачные платформы (RunDiffusion, MimicPC и др.) | По тарифу платформы |
Плюсы и минусы
| ✅ Плюсы | ❌ Минусы |
|---|---|
| Полностью бесплатно и open-source | Заморожен на архитектуре SDXL — нет поддержки Flux |
| Установка в 1–3 клика | Активная разработка прекращена (LTS с 2024) |
| Интуитивный интерфейс, как у Midjourney | Меньше расширений, чем у A1111 или ComfyUI |
| Работает офлайн, без облачных подписок | Нет нативного ControlNet |
| Умное авторасширение промптов (GPT-2) | Upscaling текста на изображениях работает плохо |
| Собственные алгоритмы Inpaint и Image Prompt | Ограниченная кастомизация по сравнению с ComfyUI |
| Минимальные требования: 4 ГБ VRAM | Фейковые сайты создают путаницу для новичков |
| Поддержка до 5 LoRA одновременно | Нет встроенной поддержки новых моделей (SD3, FLUX) |
Сравнение с альтернативами
ComfyUI предлагает максимальный контроль через нодовые воркфлоу, Automatic1111 обеспечивает лучший баланс функциональности и удобства, тогда как Fooocus предоставляет наиболее простой опыт для начинающих.
| Параметр | Fooocus | Automatic1111 (A1111) | ComfyUI |
|---|---|---|---|
| Сложность освоения | ⭐ Очень низкая | ⭐⭐⭐ Средняя | ⭐⭐⭐⭐⭐ Высокая |
| Скорость установки | 1–3 клика | ~15 мин | ~20 мин |
| Интерфейс | Минималистичный | Традиционный UI | Нодовый граф |
| Поддержка Flux | ❌ Нет | ⚠️ Через Forge | ✅ Да |
| Расширения/плагины | Ограничено | Очень широкий выбор | Широкий выбор |
| LoRA | До 5 | Без ограничений | Без ограничений |
| Inpaint качество | Собственный алгоритм | Стандартный SDXL | Настраиваемый |
| Подходит для новичков | ✅ Идеально | ✅ Хорошо | ❌ Сложно |
| Подходит для профи | ⚠️ Ограничено | ✅ Хорошо | ✅ Идеально |
| Цена | Бесплатно | Бесплатно | Бесплатно |
Большинство пользователей начинают с Fooocus, затем переходят на SD WebUI Forge для расширенных функций и поддержки Flux, и наконец осваивают ComfyUI для производственных воркфлоу.
Automatic1111 — ежедневный инструмент для большинства задач с широкой экосистемой плагинов.
ComfyUI — сложные производственные пайплайны и работа с новейшими моделями (Flux, SD3.5).
Быстрый старт: установка на Windows
# 1. Скачайте ZIP-архив с GitHub releases
# 2. Распакуйте и запустите run.bat
# При первом запуске модели скачаются автоматически
# Или через Git:
git clone https://github.com/lllyasviel/Fooocus.git
cd Fooocus
pip install -r requirements_versions.txt
python entry_with_update.py
Для Linux:
git clone https://github.com/lllyasviel/Fooocus.git
cd Fooocus
python3 -m venv fooocus_env
source fooocus_env/bin/activate
pip install -r requirements_versions.txt
python entry_with_update.py
Вердикт
Для начинающих и casual-пользователей Fooocus — настоящая революция. Это эквивалент качественного мобильного фоторедактора: простой, быстрый, способный выдавать впечатляющие результаты без изучения документации. Он снизил барьер входа в AI-арт для миллионов людей, доказав, что высококачественная AI-генерация не требует «PhD по инжинирингу промптов».
Однако важно понимать контекст: проект Fooocus, построенный полностью на архитектуре Stable Diffusion XL, сейчас находится в состоянии ограниченной долгосрочной поддержки с исправлением только ошибок. Новые архитектуры (Flux, SD3.5) официально не поддерживаются.
Кому подойдёт Fooocus?
- ✅ Новичкам в AI-генерации изображений
- ✅ Пользователям Midjourney, ищущим бесплатную локальную альтернативу
- ✅ Тем, кто хочет быстро получить красивый результат без настройки
- ✅ Преподавателям и студентам, изучающим AI-арт
- ⚠️ Продвинутым пользователям — только как дополнение к ComfyUI/Forge
Рейтинг: 8 / 10
| Критерий | Оценка |
|---|---|
| Простота использования | 10/10 |
| Качество изображений (SDXL) | 9/10 |
| Функциональность | 7/10 |
| Актуальность (поддержка новых моделей) | 5/10 |
| Установка и системные требования | 9/10 |
| Сообщество и документация | 8/10 |
На GitHub проект набрал более 47 700 звёзд и имеет около 7 784 форков — это свидетельство огромного влияния Fooocus на экосистему open-source AI-арта.