
Как разработчики ломают шаблон prompt→response при работе с LLM
Сообщество Hacker News обсуждает нестандартные эксперименты с LLM для кодинга: hermetic agents, рои моделей на домашнем железе и mesh-координация.
Надоел цикл prompt→response? Разработчики ищут выход
На Hacker News развернулась живая дискуссия: разработчики признаются, что стандартный цикл «написал промпт — подождал — проверил — написал снова» убивает состояние потока (flow state). Один из авторов темы описал происходящее точно: «ИИ должен быть велосипедом для ума, но сейчас это велосипед, который резко тормозит каждые несколько минут». Участники делятся нестандартными экспериментами — от изолированных агентских пар до роя из десятка разнородных моделей на домашнем железе.
Hermetic agents: агенты, которые не знают друг о друге
Один из самых интересных подходов в обсуждении — так называемые hermetic agents (изолированные агенты). Идея проста: два агента работают по одной спецификации, но полностью изолированы друг от друга. Первый пишет код, второй — тесты, причём ни один из них не видит результат работы другого.
«Мы пытаемся получить более высокое качество, избегая confirmation bias между кодом и тестами»
Автор подхода признаёт: это скорее управление процессами, чем программирование. Большую часть времени он тратит на отладку самих агентских пайплайнов, а не на написание бизнес-логики.
graph TD
S[Спецификация] --> CA[Агент-кодер]
S --> TA[Агент-тестировщик]
CA -->|Код без тестов| QA[QA-агент]
TA -->|Тесты без кода| QA
QA -->|Обратная связь| CA
QA -->|Обратная связь| TA
QA --> R[Результат]
Mesh-координация между агентами: приложение и инфраструктура
Другой участник описал эксперимент с gossip-based mesh — сетью агентов, где агент приложения и агент инфраструктуры общаются напрямую и сами вырабатывают рабочие процессы:
"""
Claude Code mesh: gossip-based multi-instance coordination.
Usage:
mesh.py register --id ID --repo PATH --keyword KEYWORD
mesh.py send --from ID --to ID MESSAGE
mesh.py broadcast --from ID MESSAGE
mesh.py watch --id ID
mesh.py peers --id ID [--n N]
"""
Агенты изобрели собственный рабочий протокол поверх предоставленного инструмента. Автор честен: это выглядит как будущее, но вызывает опасения с точки зрения экологии и экономики.
Рой из десятка LLM на домашнем железе
Самый экзотический эксперимент — у пользователя с «драконьей сокровищницей» из GPU последних 20 лет. Он подключил к домашней сети всё железо с VRAM от 3 ГБ и запустил гетерогенный рой из более чем 10 уникальных моделей — от llama3.2:3b до Qwen3:27b.
| Аспект | Ожидание | Реальность |
|---|---|---|
| Написание кода | Отличные результаты | Слабее, чем ожидалось |
| Сбор мнений / анализ | Вспомогательная функция | Неожиданно высокое качество |
| Дебаты между моделями | Эксперимент | Интересные и нетривиальные результаты |
| Автороутинг задач | Целевая функция | В разработке |
Конечная цель — автономная маршрутизирующая сеть, которая сама учится, какие модели лучше справляются с теми или иными задачами, и интеллектуально распределяет запросы.
Контекст: куда движется индустрия
Мульти-агентные LLM-системы — это архитектуры, где несколько специализированных агентов, каждый из которых управляется языковой моделью, работают совместно для решения сложных задач. Исследования показывают 67% улучшение точности кода по сравнению с подходами на основе одного агента при 95% успешности в сложных задачах.
В этом есть что-то мощное: когда два разных агента думают об одной и той же проблеме и общаются по ней — даже если они работают последовательно и даже если человек копирует результаты между ними вручную.
Детерминированные workflow решают иную проблему, чем просто команды агентов: когда нужно, чтобы сам поток управления был предсказуемым, а не определялся моделью пошагово. Именно динамические workflow и adversarial code review позволили переписать Bun с Zig на Rust за шесть дней.
Общий сигнал из обсуждения: разработчики всё больше ощущают себя не кодерами, а менеджерами процессов — они настраивают агентские пайплайны, дебажат взаимодействие между моделями и определяют границы доступа. Это новая профессия, и индустрия только начинает нащупывать её контуры.