MemPalace: лучший open-source AI memory 2026

«Verbatim storage, pluggable backend, 96.6% R@5 raw on LongMemEval — zero API calls.»

Что это и для кого

MemPalace — бесплатная open-source система памяти для больших языковых моделей, дающая им постоянную, кросс-сессионную память. Проект появился из личной боли: его создали актриса Милла Йовович и разработчик Бен Сигман после того, как её разочаровали существующие системы памяти — все они сами решали, что запоминать, выбрасывая контекст и рассуждения, которые ей действительно были нужны.

Проект лицензирован по MIT, поддерживает Claude Code, ChatGPT и Cursor через MCP, и собрал более 19 500 звёзд на GitHub с момента запуска.

Кому подойдёт:

  • Разработчикам, активно использующим Claude Code, Cursor или Gemini CLI
  • Исследователям и авторам, которые хотят сохранять историю взаимодействий с AI
  • Командам, которым важна полная конфиденциальность данных
  • Всем, кто хочет постоянную память для LLM без облачных подписок
ℹ Философия проекта
В отличие от Mem0 и Zep, которые используют LLM для извлечения «ключевых фактов» и выбрасывают остальное, MemPalace хранит всё дословно и находит нужное через семантический поиск. Что сегодня кажется незначительным — завтра может оказаться критичным.

Ключевые возможности

1. Дословное хранение (Verbatim Storage)

MemPalace хранит историю разговоров как дословный текст и извлекает её через семантический поиск. Он не резюмирует, не извлекает и не перефразирует. Это принципиальное архитектурное решение: MemPalace хранит всё, затем делает это находимым через пространственную организацию и многоуровневое извлечение.

2. Архитектура «дворца памяти»

Индекс структурирован — люди и проекты становятся «крыльями» (wings), темы — «комнатами» (rooms), а оригинальный контент хранится в «ящиках» (drawers) — так поиск можно ограничивать, а не гонять по плоскому корпусу.


graph TD
    A[🏛️ Palace / Дворец] --> B[🪟 Wing / Крыло\nПерсона или проект]
    A --> C[🪟 Wing / Крыло\nДругой проект]
    B --> D[🚪 Room / Комната\nДень или сессия]
    D --> E[🗄️ Closet / Шкаф\nТематическая группа]
    E --> F[📦 Drawer / Ящик\nДословный фрагмент]
    F --> G[🔍 Semantic Search\nВекторный поиск]
    G --> H[💬 LLM Context]

Поиск сочетает векторное сходство (60%) с ключевым соответствием BM25 (40%) — это помогает находить точные имена, коды проектов и сообщения об ошибках, которые пропускают эмбеддинги.

3. Полностью локальная работа

Извлечение, разбивка на чанки и эмбеддинги — всё выполняется локально. Никаких ключей OpenAI, Anthropic или sentence-transformers. Память работает даже офлайн, в самолёте.

4. Поддержка агентов и MCP

MCP-сервер включает 19 инструментов и автоматически обучает AAAK-компрессии вашего AI. Каждый агент-специалист получает своё крыло и дневник во дворце.

5. AAAK-компрессия

AAAK — 30-кратное сжатие без потерь, работает с любым LLM: Claude, GPT, Gemini, Llama, Mistral.

6. Граф знаний

Связи между сущностями с датами «действителен с» и «действителен до»: кто над чем работал, когда это изменилось, факты, которые были истинны тогда и могут быть неверны сейчас. Граф хранится в SQLite — локально и бесплатно.

7. Мультиязычность

MemPalace поддерживает английский, французский, корейский, японский, испанский, немецкий, упрощённый и традиционный китайский. CLI-вывод, инструкции AAAK-компрессии и regex-паттерны локализованы.


Быстрый старт

# Установка через uv (рекомендуется)
uv tool install mempalace

# Или через pip в virtualenv
python -m venv .venv && source .venv/bin/activate
pip install mempalace

# Инициализация дворца
mempalace init ~/projects/myapp

# Загрузка контента в память
mempalace mine ~/projects/myapp           # файлы проекта
mempalace mine ~/.claude/projects/ --mode convos  # Claude Code сессии

# Поиск
mempalace search "почему мы перешли на GraphQL"

# Загрузка контекста для новой сессии
mempalace wake-up

Онбординг предлагает два варианта модели эмбеддингов: embedding-gemma-300m (многоязычный, 100+ языков, рекомендуется) или all-MiniLM-L6-v2 (только английский, ~30 МБ).

💡 Совет по установке
Используйте uv tool install mempalace или pipx install mempalace для изолированного окружения. Это предотвращает конфликты зависимостей (chromadb, numpy, grpcio) с вашим глобальным Python-окружением.

Бенчмарки

Сырой результат 96.6% не требует API-ключа, облака или LLM ни на одном этапе. Гибридный пайплайн добавляет keyword boosting, temporal-proximity boosting и извлечение паттернов предпочтений; удержанный показатель 98.4% — честная обобщаемая цифра.

⚠ Важно про 100% на LongMemEval
Заявленный показатель 100% вызвал споры: исследователи выяснили, что он был достигнут после точечных правок под конкретные провальные вопросы из тестового набора, а не на отложенных данных. Честный воспроизводимый показатель — 96.6%, что всё равно выше любого бесплатного конкурента.

96.6% R@5 на LongMemEval — достигнутый без LLM на этапе записи — подтверждает, что сырое хранилище + хорошие эмбеддинги превосходят extraction-based конкурентов.


Тарифы и цены

MemPalace бесплатен навсегда (лицензия MIT). Нет платных планов, нет подписок, нет ограничений по объёму.

КомпонентСтоимость
Сам инструментБесплатно (MIT)
API-ключи для работыНе нужны
Облачная инфраструктураНе нужна
Дисковое место (модель эмбеддингов)~300 МБ
Опциональный бэкенд (Qdrant, pgvector)По вашему выбору

Плюсы и минусы

✅ Плюсы❌ Минусы
Полностью бесплатно, MIT-лицензияТребует Python и CLI-навыков
Лучший показатель recall среди бесплатных решений (96.6%)~300 МБ под модель эмбеддингов
Данные не покидают вашу машинуНет управляемого облака / SaaS
Работает офлайнНет корпоративных SLA и SOC2
Поддержка Claude Code, ChatGPT, Cursor через MCPБенчмарк 100% оказался завышен
Дословное хранение — не теряет контекстТребует ручной настройки хуков
Граф знаний в SQLite локальноМолодой проект, возможны breaking changes
8 языков интерфейсаНет GUI — только CLI

Сравнение с альтернативами

Mem0 — ближайший конкурент MemPalace. Оба дают AI-агентам постоянную память, но отличаются архитектурой: MemPalace достигает 96.6% против ~85% Mem0 на LongMemEval.

ПараметрMemPalaceMem0Zep
ЦенаБесплатно (MIT)$0–249/мес$25/мес+
LongMemEval (R@5)96.6% (raw)~85%~85%
ХранениеДословное, локальноОблако (LLM-извлечение)Облако (граф знаний)
API-ключиНе нужныНужныНужны
Офлайн-работа
КонфиденциальностьПолная (local-first)Данные в облакеДанные в облаке
Сложность настройкиСредняя (CLI)Низкая (managed)Низкая (managed)
MCP-сервер✅ 19 инструментов
SOC2/HIPAA✅ (Enterprise)
GitHub звёзды19 500+48 000+н/д

MemPalace использует лишь 170 токенов при старте против ~2 000 у Mem0 — это в 10 раз меньше контекстного окна.

Выбирайте MemPalace, если хотите лучшую точность, нулевые расходы, полную приватность и готовы к self-hosting; Mem0 — если нужна управляемая облачная инфраструктура с корпоративными SLA; Zep — если требуется соответствие SOC2/HIPAA или сложные графы знаний на Neo4j.

📝 Пример использования с Claude Code
Подключите два хука: один сохраняет память каждые N сообщений, второй срабатывает перед сжатием контекста. После этого каждая сессия Claude Code автоматически попадает в дворец и становится доступной в будущих сессиях через mempalace wake-up.

Вердикт

MemPalace — принципиально честный подход к проблеме памяти LLM: вместо того чтобы доверять AI-извлечению решать, что важно, он хранит всё и находит нужное через умный поиск. Даже без завышенных заявлений, честные цифры бьют каждую бесплатную альтернативу: 96.6% raw recall на LongMemEval — наивысший опубликованный показатель для любой локальной системы памяти с нулевой стоимостью.

Кому подойдёт:

  • 🧑‍💻 Разработчикам с активными Claude Code / Cursor сессиями
  • 🔒 Всем, кто не может отправлять данные в облако
  • 💰 Стартапам и исследователям с ограниченным бюджетом
  • 🌍 Командам, работающим с нелатинскими языками

Кому не подойдёт:

  • Командам, нуждающимся в корпоративных SLA и SOC2-сертификации
  • Пользователям без технических навыков (нет GUI)
  • Проектам, требующим коллаборативной облачной памяти

Рейтинг: 8.5 / 10

КритерийОценка
Производительность (recall)9/10
Простота установки7/10
Конфиденциальность10/10
Стоимость10/10
Зрелость проекта7/10
Экосистема / интеграции8/10