MemPalace: лучший open-source AI memory 2026

«Verbatim storage, pluggable backend, 96.6% R@5 raw on LongMemEval — zero API calls.»

Что это и для кого

MemPalace — бесплатная open-source система памяти для больших языковых моделей, дающая им постоянную, кросс-сессионную память. Проект появился из личной боли: его создали актриса Милла Йовович и разработчик Бен Сигман после того, как её разочаровали существующие системы памяти — все они сами решали, что запоминать, выбрасывая контекст и рассуждения, которые ей действительно были нужны.

Проект лицензирован по MIT, поддерживает Claude Code, ChatGPT и Cursor через MCP, и собрал более 19 500 звёзд на GitHub с момента запуска.

Кому подойдёт:

Разработчикам, активно использующим Claude Code, Cursor или Gemini CLI
Исследователям и авторам, которые хотят сохранять историю взаимодействий с AI
Командам, которым важна полная конфиденциальность данных
Всем, кто хочет постоянную память для LLM без облачных подписок

ℹ Философия проекта

В отличие от Mem0 и Zep, которые используют LLM для извлечения «ключевых фактов» и выбрасывают остальное, MemPalace хранит всё дословно и находит нужное через семантический поиск. Что сегодня кажется незначительным — завтра может оказаться критичным.

Ключевые возможности

1. Дословное хранение (Verbatim Storage)

MemPalace хранит историю разговоров как дословный текст и извлекает её через семантический поиск. Он не резюмирует, не извлекает и не перефразирует. Это принципиальное архитектурное решение: MemPalace хранит всё, затем делает это находимым через пространственную организацию и многоуровневое извлечение.

2. Архитектура «дворца памяти»

Индекс структурирован — люди и проекты становятся «крыльями» (wings), темы — «комнатами» (rooms), а оригинальный контент хранится в «ящиках» (drawers) — так поиск можно ограничивать, а не гонять по плоскому корпусу.


graph TD
    A[🏛️ Palace / Дворец] --> B[🪟 Wing / Крыло\nПерсона или проект]
    A --> C[🪟 Wing / Крыло\nДругой проект]
    B --> D[🚪 Room / Комната\nДень или сессия]
    D --> E[🗄️ Closet / Шкаф\nТематическая группа]
    E --> F[📦 Drawer / Ящик\nДословный фрагмент]
    F --> G[🔍 Semantic Search\nВекторный поиск]
    G --> H[💬 LLM Context]

Поиск сочетает векторное сходство (60%) с ключевым соответствием BM25 (40%) — это помогает находить точные имена, коды проектов и сообщения об ошибках, которые пропускают эмбеддинги.

3. Полностью локальная работа

Извлечение, разбивка на чанки и эмбеддинги — всё выполняется локально. Никаких ключей OpenAI, Anthropic или sentence-transformers. Память работает даже офлайн, в самолёте.

4. Поддержка агентов и MCP

MCP-сервер включает 19 инструментов и автоматически обучает AAAK-компрессии вашего AI. Каждый агент-специалист получает своё крыло и дневник во дворце.

5. AAAK-компрессия

AAAK — 30-кратное сжатие без потерь, работает с любым LLM: Claude, GPT, Gemini, Llama, Mistral.

6. Граф знаний

Связи между сущностями с датами «действителен с» и «действителен до»: кто над чем работал, когда это изменилось, факты, которые были истинны тогда и могут быть неверны сейчас. Граф хранится в SQLite — локально и бесплатно.

7. Мультиязычность

MemPalace поддерживает английский, французский, корейский, японский, испанский, немецкий, упрощённый и традиционный китайский. CLI-вывод, инструкции AAAK-компрессии и regex-паттерны локализованы.

Быстрый старт

# Установка через uv (рекомендуется)
uv tool install mempalace

# Или через pip в virtualenv
python -m venv .venv && source .venv/bin/activate
pip install mempalace

# Инициализация дворца
mempalace init ~/projects/myapp

# Загрузка контента в память
mempalace mine ~/projects/myapp           # файлы проекта
mempalace mine ~/.claude/projects/ --mode convos  # Claude Code сессии

# Поиск
mempalace search "почему мы перешли на GraphQL"

# Загрузка контекста для новой сессии
mempalace wake-up

Онбординг предлагает два варианта модели эмбеддингов: embedding-gemma-300m (многоязычный, 100+ языков, рекомендуется) или all-MiniLM-L6-v2 (только английский, ~30 МБ).

💡 Совет по установке

Используйте uv tool install mempalace или pipx install mempalace для изолированного окружения. Это предотвращает конфликты зависимостей (chromadb, numpy, grpcio) с вашим глобальным Python-окружением.

Бенчмарки

Сырой результат 96.6% не требует API-ключа, облака или LLM ни на одном этапе. Гибридный пайплайн добавляет keyword boosting, temporal-proximity boosting и извлечение паттернов предпочтений; удержанный показатель 98.4% — честная обобщаемая цифра.

⚠ Важно про 100% на LongMemEval

Заявленный показатель 100% вызвал споры: исследователи выяснили, что он был достигнут после точечных правок под конкретные провальные вопросы из тестового набора, а не на отложенных данных. Честный воспроизводимый показатель — 96.6%, что всё равно выше любого бесплатного конкурента.

96.6% R@5 на LongMemEval — достигнутый без LLM на этапе записи — подтверждает, что сырое хранилище + хорошие эмбеддинги превосходят extraction-based конкурентов.

Тарифы и цены

MemPalace бесплатен навсегда (лицензия MIT). Нет платных планов, нет подписок, нет ограничений по объёму.

Компонент	Стоимость
Сам инструмент	Бесплатно (MIT)
API-ключи для работы	Не нужны
Облачная инфраструктура	Не нужна
Дисковое место (модель эмбеддингов)	~300 МБ
Опциональный бэкенд (Qdrant, pgvector)	По вашему выбору

Плюсы и минусы

✅ Плюсы	❌ Минусы
Полностью бесплатно, MIT-лицензия	Требует Python и CLI-навыков
Лучший показатель recall среди бесплатных решений (96.6%)	~300 МБ под модель эмбеддингов
Данные не покидают вашу машину	Нет управляемого облака / SaaS
Работает офлайн	Нет корпоративных SLA и SOC2
Поддержка Claude Code, ChatGPT, Cursor через MCP	Бенчмарк 100% оказался завышен
Дословное хранение — не теряет контекст	Требует ручной настройки хуков
Граф знаний в SQLite локально	Молодой проект, возможны breaking changes
8 языков интерфейса	Нет GUI — только CLI

Сравнение с альтернативами

Mem0 — ближайший конкурент MemPalace. Оба дают AI-агентам постоянную память, но отличаются архитектурой: MemPalace достигает 96.6% против ~85% Mem0 на LongMemEval.

Параметр	MemPalace	Mem0	Zep
Цена	Бесплатно (MIT)	$0–249/мес	$25/мес+
LongMemEval (R@5)	96.6% (raw)	~85%	~85%
Хранение	Дословное, локально	Облако (LLM-извлечение)	Облако (граф знаний)
API-ключи	Не нужны	Нужны	Нужны
Офлайн-работа	✅	❌	❌
Конфиденциальность	Полная (local-first)	Данные в облаке	Данные в облаке
Сложность настройки	Средняя (CLI)	Низкая (managed)	Низкая (managed)
MCP-сервер	✅ 19 инструментов	✅	✅
SOC2/HIPAA	❌	✅ (Enterprise)	✅
GitHub звёзды	19 500+	48 000+	н/д

MemPalace использует лишь 170 токенов при старте против ~2 000 у Mem0 — это в 10 раз меньше контекстного окна.

Выбирайте MemPalace, если хотите лучшую точность, нулевые расходы, полную приватность и готовы к self-hosting; Mem0 — если нужна управляемая облачная инфраструктура с корпоративными SLA; Zep — если требуется соответствие SOC2/HIPAA или сложные графы знаний на Neo4j.

📝 Пример использования с Claude Code

Подключите два хука: один сохраняет память каждые N сообщений, второй срабатывает перед сжатием контекста. После этого каждая сессия Claude Code автоматически попадает в дворец и становится доступной в будущих сессиях через mempalace wake-up.

Вердикт

MemPalace — принципиально честный подход к проблеме памяти LLM: вместо того чтобы доверять AI-извлечению решать, что важно, он хранит всё и находит нужное через умный поиск. Даже без завышенных заявлений, честные цифры бьют каждую бесплатную альтернативу: 96.6% raw recall на LongMemEval — наивысший опубликованный показатель для любой локальной системы памяти с нулевой стоимостью.