Graphify: превращаем кодовую базу в граф знаний для AI-ассистентов

«AI coding assistants read files. They don’t build maps of how concepts relate across your project.» — Augment Code о проблеме, которую решает Graphify

Что это и для кого

Graphify — это open-source скилл, который помогает AI-ассистентам кодирования понимать мультимодальные кодовые базы, строя из кода, документов, научных статей и диаграмм запрашиваемый граф знаний.

Graphify полезен в ситуациях, когда AI-ассистент продолжает читать файлы, не понимая, как части проекта связаны друг с другом. Вместо поиска по тексту он строит граф из кода, документов, схем, медиа и файлов проекта, а затем предоставляет Claude Code, Codex, Cursor, Gemini CLI и аналогичным инструментам структуру, которую можно запрашивать.

Для кого предназначен:

— Разработчики, которые хотят, чтобы Claude Code, Codex, Cursor и Gemini CLI лучше понимали структуру проекта; — люди, которым нужно быстро разобраться в большой незнакомой кодовой базе; — команды, анализирующие код, SQL-схемы, документы и конфигурацию вместе; — специалисты, проводящие архитектурный анализ, ревью PR или анализ влияния рефакторинга; — команды, которые хотят предоставить знания о проекте как MCP-инструмент для агентов.

Graphify — поддерживаемый Y Combinator open-source инструмент, превращающий целые кодовые базы в запрашиваемые графы знаний, достигший 63 200 звёзд на GitHub и 6 500 форков.

ℹ Популярность
По данным на конец июня 2026 года, Graphify набрал свыше 72 000 звёзд на GitHub и более 1,2 млн загрузок с PyPI. Проект выпускает обновления практически каждый день.

Как это работает

Комбинируя статический анализ через Tree-sitter с LLM-семантической экстракцией, Graphify превращает весь репозиторий — включая исходный код, документацию, научные работы и диаграммы — в интерактивный граф, который объясняет как что делает код, так и почему он был спроектирован именно так.


graph LR
    A[📁 Папка проекта] --> B[Tree-sitter AST\nлокальный разбор]
    A --> C[LLM экстрактор\nдокументы / изображения / видео]
    B --> D[NetworkX граф]
    C --> D
    D --> E[Leiden кластеризация]
    E --> F[graph.json]
    E --> G[GRAPH_REPORT.md]
    E --> H[graph.html]
    F --> I[AI-ассистент\nClaude / Cursor / Codex]
    G --> I

Минимальный рабочий процесс прост. После установки достаточно ввести /graphify . внутри вашего AI-ассистента. Это генерирует директорию graphify-out/ с тремя ключевыми файлами: интерактивный graph.html, который можно открыть в браузере с кликабельными узлами, фильтрами и поиском; GRAPH_REPORT.md с ключевыми концептами, неожиданными связями и предлагаемыми вопросами; graph.json — полный граф, доступный для запросов в любое время без повторного чтения файлов.


Ключевые возможности

1. Мультимодальная загрузка данных

Можно добавить код, PDF, markdown, скриншоты, диаграммы, фото с досок, изображения на других языках, а также видео- и аудиофайлы — Graphify извлекает концепции и отношения из всего этого и соединяет их в один граф.

Для кода поддерживается 31 язык программирования, включая Python, TypeScript, JavaScript, Go, Rust, Java, C/C++, Ruby, C#, Kotlin, Scala, PHP, Swift, Lua, Zig, PowerShell, SQL, Shell, JSON и другие.

2. Локальная обработка кода без API-вызовов

Код извлекается локально без каких-либо API-вызовов (AST через tree-sitter). Всё остальное проходит через API модели вашего AI-ассистента.

Корпус только из кода не требует API-ключа — graphify extract работает полностью офлайн. Видео и аудио транскрибируются локально через faster-whisper. Ничто не покидает вашу машину.

3. Confidence-теги для каждой связи

Graphify строит постоянный структурированный граф с типизированными рёбрами (imports, calls, contains) и тегами достоверности (EXTRACTED, INFERRED, AMBIGUOUS). Ассистент может отвечать на структурные вопросы вроде «что зависит от этого сервиса» без сканирования всего репозитория каждый раз.

4. «God nodes» и неожиданные связи

God nodes — самые связанные концепты в вашем проекте: через них проходит всё. Surprising connections — ссылки между сущностями, живущими в разных файлах или модулях, ранжированные по степени неожиданности.

«The why» — встроенные комментарии (# NOTE:, # WHY:, # HACK:), docstrings и проектная логика из документов извлекаются как отдельные узлы, связанные с объясняемым кодом.

5. Поддержка командной работы

Один человек запускает /graphify . и коммитит graphify-out/. Все остальные делают pull — их ассистент немедленно читает граф.

Запустите graphify hook install для автоматической пересборки после каждого коммита (только AST, без API-затрат). Это также настраивает merge-драйвер для git, чтобы graph.json никогда не оставался с маркерами конфликтов — два разработчика, коммитящие параллельно, получат автоматическое union-слияние графов.

6. MCP-сервер и PR-анализ

MCP-сервер предоставляет возможности: query_graph, get_node, get_neighbors, shortest_path, list_prs, get_pr_impact и triage_prs.

Анализ PR: graphify prs --triage ранжирует очередь ревью по влиянию на граф. graphify prs --conflicts отмечает PR, затрагивающие перекрывающиеся сообщества графа, выявляя риски порядка слияния.

7. Снижение потребления токенов

Graphify обеспечивает в 71,5 раза меньше токенов на запрос по сравнению с сырым контекстом.

💡 Пример запроса

После построения графа можно задавать структурные вопросы прямо в CLI:

graphify query "что соединяет auth с базой данных?"
graphify path "UserService" "DatabasePool"
graphify explain "RateLimiter"

Вместо сканирования файлов ассистент получит сфокусированный подграф с путём от auth-хендлеров через сервисы к нужным таблицам.


Установка и начало работы

Требования: Python 3.10+ и один из поддерживаемых AI-ассистентов: Claude Code, Codex, OpenCode, Cursor, Gemini CLI, GitHub Copilot CLI, VS Code Copilot Chat, Aider, OpenClaw, Factory Droid, Trae, Kiro, Hermes или Google Antigravity.

# Рекомендуемый способ (uv автоматически добавляет в PATH)
uv tool install graphifyy && graphify install

# Или через pipx
pipx install graphifyy && graphify install

# Или pip (может потребоваться настройка PATH)
pip install graphifyy && graphify install

Официальный пакет на PyPI называется graphifyy (с двойной y). Другие пакеты graphify* на PyPI не связаны с проектом. CLI-команда по-прежнему называется graphify.

После установки откройте AI-ассистент и введите /graphify .

⚠ Windows / PowerShell

На Windows в PowerShell ведущий / трактуется как разделитель пути. Используйте graphify . вместо /graphify ..

Для Codex используйте $graphify вместо /graphify.


Тарифы и цены

Graphify является бесплатным и open-source инструментом. Проект распространяется под лицензией MIT.

Проект поддерживается Safi Shamsi, выпущен под разрешительной лицензией MIT и построен на широко используемых библиотеках, включая NetworkX и Tree-sitter.

УровеньЦенаЧто включено
Open-source (MIT)БесплатноПолный функционал: граф, MCP, CLI, командная работа
Penpax (enterprise)ОжидаетсяВсегда включённый слой поверх Graphify для всей рабочей жизни

Penpax — это постоянно включённый слой, построенный поверх Graphify: он применяет тот же подход к графу ко всей вашей рабочей жизни: встречи, история браузера, электронная почта, файлы и код, обновляясь в фоне непрерывно. Создан для людей, чья работа разбросана по сотням разговоров и документов, которые они никогда не могут полностью восстановить. Без облака, полностью на устройстве. Бесплатный пробный период скоро запустится.


Плюсы и минусы

✅ Плюсы❌ Минусы
Полностью бесплатный, MIT-лицензияТребует Python 3.10+ и настройки
Код обрабатывается локально — без API-вызововДокументы/PDF/изображения отправляются в API модели
Поддержка 20+ AI-ассистентов (Cursor, Claude, Codex, Gemini…)Первоначальная индексация крупного репозитория занимает время
31+ язык программирования через tree-sitterИмя пакета PyPI (graphifyy) легко перепутать
71x сокращение потребления токенов на запросНа Windows/PowerShell синтаксис команд отличается
Confidence-теги (EXTRACTED / INFERRED / AMBIGUOUS)Для doc/media-файлов нужен API-ключ выбранной модели
Командная работа через git-коммит graphify-out/MCP-сервер и продвинутые функции требуют изучения
Активная разработка — релизы почти каждый деньГраф может устаревать при частых коммитах без хуков
Без сервера, без Neo4j — работает полностью локальноДля Windows с >61 ядром ранее были баги (исправлены)

Сравнение с альтернативами

Graphify и Sourcegraph дополняют друг друга: Sourcegraph занимается grep по нескольким репозиториям, Graphify — структурным пониманием внутри репозитория для AI-ассистента кодирования.

Code2Vec встраивает функции в векторное пространство для извлечения и классификации. Векторы улавливают поверхностное сходство, но теряют структуру вызовов, импорты и логику проектирования. Graphify сохраняет всё это в виде типизированных рёбер и кластеризует по плотности рёбер, а не по векторному расстоянию.

ПараметрGraphifySourcegraph CodyCode2Vec / Repomix
ЛицензияMIT (бесплатно)Enterprise (платно)MIT (бесплатно)
Тип анализаГраф знаний (структурный)Поиск по коду + AIВекторный / упаковка контекста
Работает с кодом локально✅ (tree-sitter AST)❌ (облако)✅ / ✅
Поддержка AI-ассистентов20+ платформСобственный CodyЧерез контекст/CLI
Мультимодальность (PDF, видео, изображения)
Confidence-теги✅ (EXTRACTED / INFERRED / AMBIGUOUS)
MCP-сервер
Кросс-репо поиск
Командная работа✅ (git-коммит)✅ (облако)Ограничено
PR-анализ по графу
📝 Когда Graphify выигрывает
Если ваш репозиторий объединяет несколько языков, SQL-схему БД, Terraform-конфигурацию и техдокументацию — Graphify покажет, как они связаны в одном графе. Sourcegraph найдёт использования функции по всем 400 репозиториям, но не объяснит «почему» за архитектурным решением.

Технический стек

Стек: NetworkX + Leiden (graspologic) + tree-sitter + vis.js. Семантическая экстракция через Claude (Claude Code), GPT-4 (Codex) или любую модель вашей платформы. Транскрипция видео через faster-whisper + yt-dlp (опционально). Neo4j не требуется, сервер не нужен — работает полностью локально.


Вердикт: кому подойдёт

Graphify идеально подойдёт:

  • Senior-разработчикам, работающим с большими монорепозиториями
  • Командам, использующим Claude Code, Cursor или Codex на проектах с несколькими языками и БД
  • DevOps/platform engineers, объединяющим код приложения, SQL-схемы и Terraform в единый контекст
  • Всем, кто хочет снизить потребление токенов AI-ассистента и ускорить онбординг

Возможно не подойдёт:

  • Командам, которым нужен кросс-репо поиск по корпоративным монорепозиториям (→ Sourcegraph)
  • Проектам без Python 3.10+ или с жёсткими ограничениями на установку зависимостей
  • Пользователям, работающим только с маленькими (до 10 файлов) кодовыми базами — граф здесь даст структурную ясность, но не компрессию токенов

Рейтинг

КритерийОценка
Функциональность9/10
Простота установки7/10
Приватность / безопасность9/10
Активность разработки10/10
Ценность (цена/качество)10/10
Итого9/10

Graphify — один из самых продуманных open-source инструментов для AI-разработки в 2026 году. Если ваш AI-ассистент постоянно «читает файлы вслепую», не понимая архитектуры проекта, — это именно тот структурный слой, который стоит добавить первым.