Как разработчики ломают шаблон prompt→response при работе с LLM

Надоел цикл prompt→response? Разработчики ищут выход

На Hacker News развернулась живая дискуссия: разработчики признаются, что стандартный цикл «написал промпт — подождал — проверил — написал снова» убивает состояние потока (flow state). Один из авторов темы описал происходящее точно: «ИИ должен быть велосипедом для ума, но сейчас это велосипед, который резко тормозит каждые несколько минут». Участники делятся нестандартными экспериментами — от изолированных агентских пар до роя из десятка разнородных моделей на домашнем железе.

Hermetic agents: агенты, которые не знают друг о друге

Один из самых интересных подходов в обсуждении — так называемые hermetic agents (изолированные агенты). Идея проста: два агента работают по одной спецификации, но полностью изолированы друг от друга. Первый пишет код, второй — тесты, причём ни один из них не видит результат работы другого.

«Мы пытаемся получить более высокое качество, избегая confirmation bias между кодом и тестами»

Автор подхода признаёт: это скорее управление процессами, чем программирование. Большую часть времени он тратит на отладку самих агентских пайплайнов, а не на написание бизнес-логики.

ℹ Интересная параллель

Подход hermetic agents напоминает классическую систему оценки CS-задач в университетах: студенты видят только 70% тест-кейсов, остальные 30% скрыты и проверяются при сдаче. Такая схема вынуждает думать наперёд — точно так же, как изоляция агентов снижает confirmation bias.


graph TD
    S[Спецификация] --> CA[Агент-кодер]
    S --> TA[Агент-тестировщик]
    CA -->|Код без тестов| QA[QA-агент]
    TA -->|Тесты без кода| QA
    QA -->|Обратная связь| CA
    QA -->|Обратная связь| TA
    QA --> R[Результат]

Mesh-координация между агентами: приложение и инфраструктура

Другой участник описал эксперимент с gossip-based mesh — сетью агентов, где агент приложения и агент инфраструктуры общаются напрямую и сами вырабатывают рабочие процессы:

"""
Claude Code mesh: gossip-based multi-instance coordination.

Usage:
  mesh.py register --id ID --repo PATH --keyword KEYWORD
  mesh.py send --from ID --to ID MESSAGE
  mesh.py broadcast --from ID MESSAGE
  mesh.py watch --id ID
  mesh.py peers --id ID [--n N]
"""

Агенты изобрели собственный рабочий протокол поверх предоставленного инструмента. Автор честен: это выглядит как будущее, но вызывает опасения с точки зрения экологии и экономики.

⚠ Ограничения подхода

Запустить несколько агентов параллельно — просто. Получить от них надёжный результат — сложно. Именно «обвязка» (отслеживание задач, изоляция, quality gates, ревью) делает мульти-агентную разработку воспроизводимой.

Рой из десятка LLM на домашнем железе

Самый экзотический эксперимент — у пользователя с «драконьей сокровищницей» из GPU последних 20 лет. Он подключил к домашней сети всё железо с VRAM от 3 ГБ и запустил гетерогенный рой из более чем 10 уникальных моделей — от llama3.2:3b до Qwen3:27b.

Аспект	Ожидание	Реальность
Написание кода	Отличные результаты	Слабее, чем ожидалось
Сбор мнений / анализ	Вспомогательная функция	Неожиданно высокое качество
Дебаты между моделями	Эксперимент	Интересные и нетривиальные результаты
Автороутинг задач	Целевая функция	В разработке

Конечная цель — автономная маршрутизирующая сеть, которая сама учится, какие модели лучше справляются с теми или иными задачами, и интеллектуально распределяет запросы.

💡 Неожиданный вывод

Рой разнородных LLM оказался особенно полезен не для генерации кода, а для агрегации мнений: десять уникальных перспектив, сведённых в один синтез, дали удивительно высокое качество аналитики. Когда моделям разрешили «спорить» между собой — результаты стали ещё интереснее.

Контекст: куда движется индустрия

Мульти-агентные LLM-системы — это архитектуры, где несколько специализированных агентов, каждый из которых управляется языковой моделью, работают совместно для решения сложных задач. Исследования показывают 67% улучшение точности кода по сравнению с подходами на основе одного агента при 95% успешности в сложных задачах.

В этом есть что-то мощное: когда два разных агента думают об одной и той же проблеме и общаются по ней — даже если они работают последовательно и даже если человек копирует результаты между ними вручную.

Детерминированные workflow решают иную проблему, чем просто команды агентов: когда нужно, чтобы сам поток управления был предсказуемым, а не определялся моделью пошагово. Именно динамические workflow и adversarial code review позволили переписать Bun с Zig на Rust за шесть дней.

Общий сигнал из обсуждения: разработчики всё больше ощущают себя не кодерами, а менеджерами процессов — они настраивают агентские пайплайны, дебажат взаимодействие между моделями и определяют границы доступа. Это новая профессия, и индустрия только начинает нащупывать её контуры.

📝 Вывод

Самые перспективные эксперименты объединяет одно: изоляция и чёткое разделение ответственности между агентами работает лучше, чем попытки дать одной модели всё. Hermetic agents, mesh-сети и гетерогенные рои — это разные способы ответить на один вопрос: как перестать ждать и начать делегировать.

Надоел цикл prompt→response? Разработчики ищут выход

Hermetic agents: агенты, которые не знают друг о друге

Mesh-координация между агентами: приложение и инфраструктура

Рой из десятка LLM на домашнем железе

Контекст: куда движется индустрия

Источники

Похожие статьи

AI Berkshire: фреймворк стоимостного инвестирования на Claude Code

Lathe: LLM учит тебя, а не думает за тебя

learn-claude-code: как устроен агент изнутри

ARIS: ИИ-агент для ML-исследований пока вы спите

OpenAI Agents SDK 0.14: sandbox-агенты для продакшена