codebase-memory-mcp: граф знаний для AI-агентов

«Вместо того чтобы читать файлы по одному, AI-агент запрашивает граф — и отвечает на структурные вопросы примерно в 120 раз меньшим количеством токенов.»

Что это такое и для кого

codebase-memory-mcp — это open-source MCP-сервер, который индексирует любую кодовую базу в персистентный граф знаний, позволяя AI-агентам отвечать на структурные вопросы примерно в 120 раз меньшим количеством токенов.

Сервер строит граф знаний из функций, классов, цепочек вызовов, HTTP-маршрутов и межсервисных связей. Вместо того чтобы читать файлы по одному, AI-агент запрашивает граф — и получает точные ответы.

Это бэкенд структурного анализа, а не чат-бот: никакого встроенного LLM и никакого API-ключа. Ваш MCP-клиент (Claude Code или любой совместимый агент) является слоем интеллекта, а codebase-memory-mcp строит и обслуживает граф.

Для кого подойдёт:

  • Разработчики, использующие AI-ассистентов (Claude Code, Cursor, Codex CLI, Gemini CLI) в крупных проектах
  • Команды, желающие снизить расходы на токены LLM при работе с большими репозиториями
  • DevOps/SRE, работающие с микросервисными архитектурами и нуждающиеся в трассировке HTTP-маршрутов
  • Исследователи, изучающие применение графов знаний в code intelligence
ℹ Проект подтверждён наукой
Дизайн и бенчмарки описаны в препринте «Codebase-Memory: Tree-Sitter-Based Knowledge Graphs for LLM Code Exploration via MCP» (arXiv:2603.27277). Оценка на 31 реальном репозитории показала 83% качества ответов, 10× меньше токенов и 2,1× меньше вызовов инструментов по сравнению с пофайловым исследованием.

Ключевые возможности

1. Поддержка 158 языков программирования

Высококачественный парсинг через tree-sitter AST-анализ для всех 158 языков, дополненный гибридным LSP-разрешением семантических типов для Python, TypeScript/JavaScript/JSX/TSX, PHP, C#, Go, C, C++, Java, Kotlin и Rust — с построением персистентного графа знаний из функций, классов, цепочек вызовов, HTTP-маршрутов и межсервисных связей.

2. Экстремальная эффективность токенов

Пять структурных запросов потребляли ~3 400 токенов через codebase-memory-mcp против ~412 000 токенов при пофайловом grep-поиске — снижение на 99,2%.

Для агентов, платящих за токен, это разница между поиском за $4 и поиском за $0,03.

3. Молниеносная индексация и sub-ms запросы

codebase-memory-mcp индексирует любую кодовую базу в персистентный граф знаний, поддерживает 158 языков, гибридное LSP-разрешение типов, локальный семантический векторный поиск, определение клонов кода и sub-1ms запросы. Ядро Linux индексируется за 3 минуты.

Конвейер индексации работает в памяти (LZ4 HC сжатие при чтении, SQLite в памяти, единый дамп в конце). После завершения индексации память освобождается обратно ОС.

4. 14 MCP-инструментов

codebase-memory-mcp строит персистентный граф знаний, захватывающий функции, классы, цепочки вызовов, импорты, HTTP-маршруты и межсервисные связи — а затем предоставляет 14 MCP-инструментов, позволяющих агентам запрашивать этот граф за миллисекунды.

Примеры реальных запросов:

# Трассировка: кто вызывает ProcessOrder?
You: "what calls ProcessOrder?"
# Агент автоматически вызывает:
trace_path(function_name="ProcessOrder", direction="inbound")

# Поиск по паттерну через CLI:
codebase-memory-mcp cli search_graph '{"name_pattern": ".*Handler.*"}'

5. Командная работа: общий граф в репозитории

Команде не нужно переиндексировать отдельно. Артефакт .codebase-memory/graph.db.zst можно закоммитить вместе с исходниками — это zstd-сжатый снимок графа. Когда коллега клонирует репозиторий и запускает индексатор впервые, он импортирует снимок и делает только инкрементальный diff локально, вместо полного переиндексирования.

6. 3D-визуализация графа

Опциональная UI-версия бинарника поставляется со встроенной 3D-визуализацией графа, которую можно открыть в браузере по адресу localhost:9749, работающей параллельно с MCP-сервером в фоновом потоке.

7. Поддержка 11 агентов из коробки

Система поддерживает 11 агентов из коробки, включая Claude Code, Codex CLI, Gemini CLI, Zed, OpenCode, Antigravity, Aider, KiloCode, VS Code, OpenClaw и Kiro. Команда установки автоматически определяет все установленные агенты и настраивает записи MCP, файлы инструкций, навыки и хуки предварительного вызова инструментов для каждого.

8. Безопасность и надёжность

SLSA Level 3 — криптографическое происхождение сборки, генерируемое GitHub Actions; верификация через gh attestation verify. Подписи Sigstore cosign на всех артефактах. SHA-256 контрольные суммы в каждом релизе. CodeQL SAST блокирует конвейер выпуска при наличии открытых оповещений. Нулевые зависимости во время выполнения — все библиотеки вендорены при компиляции.


Как это работает


graph TD
    A[Исходный код\n158 языков] --> B[tree-sitter AST\nпарсинг]
    B --> C[Hybrid LSP\nразрешение типов]
    C --> D[RAM-первый конвейер\nLZ4 + in-memory SQLite]
    D --> E[(Граф знаний\nSQLite .db)]
    E --> F[14 MCP-инструментов]
    F --> G[Claude Code]
    F --> H[Cursor / Zed]
    F --> I[Codex CLI / Aider]
    E --> J[3D-визуализация\nlocalhost:9749]
    E --> K[graph.db.zst\nдля команды]


Установка

Linux / macOS:

curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/scripts/setup.sh | bash

Windows (PowerShell):

irm https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/scripts/setup-windows.ps1 | iex

Доступна установка через npm (npm install -g codebase-memory-mcp), PyPI (pip install codebase-memory-mcp) и Go (go install github.com/DeusData/codebase-memory-mcp/pkg/go@latest). Также поддерживаются Homebrew, Scoop, Winget, Chocolatey и AUR.

💡 Быстрый старт через Claude Code
Простейший способ — вставить URL репозитория напрямую в Claude Code и попросить установить: «Install this MCP server: https://github.com/DeusData/codebase-memory-mcp». Агент настроит всё автоматически.

Тарифы и цены

codebase-memory-mcp — полностью бесплатный open-source проект, распространяемый через GitHub. Никаких подписок, API-ключей и облачных сервисов не требуется. Единый статический C-бинарник для macOS, Linux и Windows. Никакого Docker, никаких рантаймов, никаких API-ключей. Скачал, запустил установку — готово.

ТипСтоимость
Использование инструментаБесплатно (open-source)
Хранилище графаЛокально (SQLite)
API-ключиНе нужны
Облачная синхронизацияНет (только локально)

Плюсы и минусы

✅ Плюсы❌ Минусы
99,2% снижение потребления токеновТолько структурный анализ — не замена grep для текстового поиска
158 языков программированияТребует первоначальной индексации перед началом работы
Sub-ms запросы, RAM-first конвейерМолодой проект (версия 0.8.x, API может меняться)
Ноль зависимостей, единый бинарникОтсутствие встроенного LLM = требует MCP-совместимого клиента
Бесплатно и open-sourceНа Windows SmartScreen может показывать предупреждение
SLSA Level 3, CodeQL, Sigstore83% точности ответов (vs 92% у пофайлового агента — компромисс)
Граф можно закоммитить в репоCLI-режим менее удобен для нетехнических пользователей
11 агентов из коробкиВизуализация доступна только в UI-варианте бинарника

Сравнение с альтернативами

Параметрcodebase-memory-mcpRepomixAxon
ТипГраф знаний + MCP-серверУпаковщик репо в промптГраф + MCP + Web UI
Языки158Все (текст)Python, TS, JS, TSX, JSX
ЗапросыSub-ms, графовыеНет (статичный файл)Реальное время
Экономия токенов99,2%Высокое потребление (весь код)Не задокументировано
УстановкаОдин бинарникnpmPython + зависимости
ЦенаБесплатноБесплатноБесплатно
MCP-инструменты14ОпциональноЕсть
Визуализация графа3D (UI-версия)Нет3D WebGL (Sigma.js)
Поддержка агентов11ЛюбойClaude Code, Cursor
АктивностьАктивная (2026)АктивнаяОстановлена (март 2026)

Repomix (23k звёзд) упаковывает весь репозиторий в один XML или Markdown файл — каждую строку исходного кода в единый вывод. Это удобно для небольших проектов, но при 500 файлах репозиторий производит 500 000+ токенов.

По данным на июнь 2026, Axon остановился в развитии — последний коммит датирован 25 марта 2026 года.

⚠ Честный недостаток
По бенчмаркам препринта, codebase-memory-mcp достигает 83% качества ответов против 92% у агента с пофайловым исследованием — это компромисс в пользу скорости и экономии токенов. Для задач, требующих чтения исходного кода дословно (например, форматирование или синтаксические правки), стандартные инструменты агента по-прежнему эффективнее.

Практический пример использования

📝 Трассировка HTTP-маршрутов в микросервисах
Представьте, что у вас 5 микросервисов на Python и Go. Вопрос: «Кто вызывает /api/v2/orders?». Без codebase-memory-mcp агент прочитает десятки файлов, сожжёт 80 000+ токенов. С codebase-memory-mcp — один графовый запрос, ~500 токенов, ответ с полной цепочкой вызовов от HTTP-клиента до обработчика.

Вердикт

codebase-memory-mcp — это один из наиболее технически зрелых open-source MCP-инструментов в категории code intelligence на сегодняшний день. Поддержка 158 языков программирования и поставка в виде единого статического бинарника с нулевой зависимостью делает codebase-memory-mcp легковесным, но мощным решением для разработчиков, желающих интегрировать глубокий анализ кода в AI-воркфлоу без накладных расходов на инфраструктуру.

Переход к персистентным графам знаний вместо простых векторных эмбеддингов или извлечения сырого текста свидетельствует о зрелении пространства RAG применительно к программированию.

Кому особенно подойдёт:

  • 🟢 Командам с крупными монорепо или микросервисными проектами
  • 🟢 Всем, кто активно работает с Claude Code, Cursor или Codex CLI
  • 🟢 Тем, кто экономит на API-расходах LLM
  • 🟡 Небольшим проектам (до 50 файлов) — преимущество менее заметно
  • 🔴 Проектам, требующим исключительно облачной архитектуры

Рейтинг: 8.5/10

КритерийОценка
Производительность10/10
Простота установки9/10
Экономия токенов10/10
Поддержка языков10/10
Зрелость проекта7/10
Документация8/10
Итог8.5/10