Dograh: open source платформа для голосовых AI-агентов

«Open source, self-hostable альтернатива Vapi и Retell — от нуля до работающего бота менее чем за 2 минуты.»

Что такое Dograh и для кого он предназначен

Dograh — это open source альтернатива платформам вроде Vapi и Retell, помогающая строить голосовых AI-агентов с помощью drag-and-drop конструктора рабочих процессов. Платформа создана для разработчиков, технических команд и инди-хакеров в различных отраслях, которые хотят интегрировать мощную, настраиваемую голосовую автоматизацию в свои рабочие процессы.

Dograh AI — это open source платформа голосовых AI-агентов, которая устраняет vendor lock-in благодаря мультипровайдерной абстракции и возможности самостоятельного деплоя. Проект создан компанией Zansat Technologies Private Limited, основанной выпускниками YC и предпринимателями с опытом успешных экзитов, приверженными принципу открытости голосового AI.

Типичные сценарии использования:

  • Входящие/исходящие колл-центры — квалификация лидов, скрининг кандидатов
  • Автоматизация поддержки — ответы на FAQ, роутинг к живому агенту
  • Голосовые ассистенты для SaaS и B2B-продуктов
  • Прототипирование — быстрая проверка голосовых сценариев без вложений
ℹ Кто стоит за проектом
Dograh основан выпускниками Y Combinator и предпринимателями с успешными экзитами. Код распространяется под лицензией BSD 2-Clause и полностью открыт для аудита и форков.

Ключевые возможности

1. Drag-and-drop конструктор рабочих процессов

Платформа включает no-code конструктор агентов, конструктор телефонии, гибкие варианты деплоя и обсерваторию Langfuse. Интуитивный интерфейс перетаскивания позволяет создавать, настраивать и разворачивать агентов за минуты.

В дашборде создания рабочих процессов можно запустить голосового агента за 2 минуты: выбрать тип звонков (входящий/исходящий) и описать агента фразой «For the use cases of…». Это описание становится LLM-промптом, мгновенно генерируя настроенный воркфлоу.

2. Полная гибкость стека LLM / STT / TTS

Пользователи могут кастомизировать LLM, выбирая провайдеров: Dograh, Azure, Groq, Google или OpenAI — достаточно вставить API-ключ и выбрать режим (Default, Fast, Accurate). Для TTS доступны провайдеры Dograh, Deepgram, ElevenLabs и OpenAI с выбором голоса и модели.

API-ключи не нужны с самого начала: Dograh поставляется с автосгенерированными ключами и собственным стеком LLM / TTS / STT.

3. Телефония и интеграции

Встроенная интеграция с Twilio, Vonage, Vobiz, Cloudonix (другие провайдеры добавляются легко) — с поддержкой перевода звонков на живых агентов.

4. Self-hosted деплой одной командой

В отличие от проприетарных решений Dograh даёт: 100% открытый код без vendor lock-in, возможность деплоя где угодно, полный контроль над каждой строкой кода и настройку за 2 минуты.

Запуск через Docker:

curl -o docker-compose.yaml https://raw.githubusercontent.com/dograh-hq/dograh/main/docker-compose.yaml \
  && REGISTRY=ghcr.io/dograh-hq ENABLE_TELEMETRY=true docker compose up --pull always

Первый запуск может занять 2–3 минуты для загрузки всех образов. После запуска откройте http://localhost:3010 для создания первого голосового ассистента.

5. Мультиагентная логика и автотестирование

Dograh поддерживает входящие и исходящие AI-звонки с интеграцией Twilio и гибким движком воркфлоу, обеспечивающим кастомную мультиагентную логику для снижения галлюцинаций и улучшения контроля. Для поддержания надёжности логики предусмотрено автоматизированное тестирование агентов — AI-to-AI LoopTalk.

6. Приватность и соответствие требованиям

Конфиденциальность данных — приоритет платформы. Open source решение Dograh помогает соответствовать строгим стандартам GDPR и HIPAA, обеспечивая безопасность и полное соответствие требованиям.

💡 Быстрый старт
Чтобы создать первого бота: откройте http://localhost:3010, выберите тип звонка (Inbound/Outbound), назовите бота двумя словами (например, «Lead Qualification»), опишите сценарий в 5–10 словах и нажмите Web Call. Бот готов к тестированию прямо в браузере.

Архитектура платформы


graph TD
    A[Браузер / Телефония] --> B[FastAPI Workers]
    B --> C[PipecatEngine]
    C --> D{Провайдеры AI}
    D --> E[LLM: OpenAI / Groq / Azure / Google]
    D --> F[STT: Deepgram / OpenAI]
    D --> G[TTS: ElevenLabs / Deepgram / OpenAI]
    C --> H[Redis: состояние WS / слоты]
    B --> I[ARQ Workers: пост-обработка]
    I --> J[S3: запись звонков]
    I --> K[Langfuse: аналитика]

Платформа включает: полную прозрачность исходного кода под BSD 2-Clause License, мультипровайдерную гибкость (BYOK для LLM, STT, TTS и телефонии), Docker-first деплой одной командой, визуальный конструктор на базе React Flow и real-time обработку голоса через движок Pipecat.


Тарифы и цены

С Dograh OSS вы получаете полную платформу без vendor lock-in: деплой на собственной инфраструктуре, использование собственных API-ключей и полный контроль над данными.

Open source версия бесплатна навсегда. Когда будете готовы к масштабированию, переходите на managed-планы.

ТарифСтоимостьОписание
OSS (Self-hosted)БесплатноПолная платформа, деплой на своей инфраструктуре, без лимитов
Cloud ManagedПо запросуПолностью управляемый, инфраструктура на стороне Dograh
Enterprise / On-premПо запросуOn-prem деплой, white-glove сервис
APIПо запросуПрямой доступ к голосовым AI-возможностям через API

Облачный тариф использует 15-секундный billing pulse (большинство провайдеров тарифицируют 60-секундными интервалами) — платите только за реально использованное время.

⚠ Важно про self-hosted
Бесплатность OSS-версии не означает отсутствие затрат: при самостоятельном деплое вы оплачиваете серверную инфраструктуру, инженерное время на настройку и сопровождение, а также напрямую API ваших провайдеров LLM/STT/TTS. Оцените TCO до выбора варианта деплоя.

Плюсы и минусы

✅ Плюсы❌ Минусы
100% open source, BSD 2-ClauseТолько английский язык «из коробки» (расширяемо)
Zero platform fee — нет per-minute наценкиТребует DevOps-компетенций для production-деплоя
Self-hosted: данные остаются у вас, GDPR/HIPAAОтносительно молодой проект — экосистема плагинов только формируется
Запуск за 2 минуты одной Docker-командойManaged cloud — цены только по запросу
BYOK: свободный выбор LLM / STT / TTSАнонимная телеметрия включена по умолчанию (отключаемо)
Drag-and-drop no-code конструкторОграниченная документация по сложным edge-cases
Интеграция Twilio, Vonage, Telnyx и другихCommunity-driven поддержка (Slack), без SLA для OSS
AI-to-AI LoopTalk для автотестирования

Сравнение с альтернативами

Dograh позиционируется как open source self-hostable альтернатива Vapi и Retell с drag-and-drop конструктором воркфлоу для production-уровня голосовых агентов.

ПараметрDograhVapiRetell AI
Open Source✅ BSD 2-Clause
Self-hosted
Platform fee$0~$0.05–0.10/мин~$0.07–0.12/мин
No-code builder✅ Drag-and-drop
BYOK (свои ключи)✅ (частично)✅ (частично)
GDPR / HIPAA self-hosted✅ Полный контроль⚠️ Зависит от плана⚠️ Зависит от плана
Мультиагентная логика
ТелефонияTwilio, Vonage, Telnyx, VobizTwilio и др.Twilio и др.
Бесплатный тариф✅ OSS навсегда
Managed cloud✅ (по запросу)

Среди четырёх бесплатных альтернатив Vapi (Dograh, Pipecat, LiveKit Agents, Vocode) все открыты и самохостируемы и не берут per-minute platform fee поверх счетов AI-провайдеров.

Dograh vs Voiceflow

Dograh предоставляет open source решение без platform fees, что делает его более экономичным, настраиваемым и масштабируемым. Для сравнения: Voiceflow берёт от $60 за редактора в месяц, и стоимость растёт вместе с командой.


Пример: создание агента квалификации лидов

📝 Сценарий: квалификация заявок в страховании
  1. Запустите платформу: docker compose up
  2. Откройте http://localhost:3010
  3. Выберите Outbound, назовите бота «Lead Qualifier»
  4. Опишите сценарий: «Screen insurance form submissions for purchase intent»
  5. Нажмите Web Call — бот сразу готов к тесту
  6. Подключите Twilio для реальных звонков
# Пример вызова Dograh API для инициации исходящего звонка
import requests

response = requests.post(
    "https://api.dograh.com/v1/calls/outbound",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    json={
        "agent_id": "lead-qualifier-001",
        "to": "+71234567890",
        "from": "+19876543210"
    }
)
print(response.json())

Вердикт

Dograh подойдёт:

  • Разработчикам и техкомандам, которым нужен полный контроль над голосовой AI-инфраструктурой
  • Компаниям с требованиями GDPR/HIPAA, не готовым отдавать данные звонков третьей стороне
  • Стартапам, которые хотят избежать per-minute platform fee при масштабировании
  • Тем, кто ищет open source альтернативу Vapi или Retell с no-code интерфейсом

Не подойдёт:

  • Командам без DevOps-экспертизы, которым нужен полностью управляемый SaaS «под ключ» прямо сейчас
  • Проектам с критичной потребностью в многоязычности «из коробки»

Рейтинг: 8 / 10

КритерийОценка
Простота запуска9/10
Гибкость и кастомизация10/10
Экономичность (OSS)10/10
Зрелость экосистемы6/10
Документация7/10
Поддержка языков6/10

Dograh — это редкий случай, когда open source проект не жертвует удобством ради открытости. Для команд, ценящих контроль над данными и отсутствие platform fees, это сильнейший выбор на рынке голосовых AI-агентов в 2026 году.