Supermemory: Memory API для AI-агентов нового поколения
Обзор Supermemory — быстрого и масштабируемого движка памяти для LLM и AI-агентов. Ключевые функции, тарифы, сравнение с Mem0 и Zep, плюсы и минусы.
Supermemory: Memory API для AI-агентов нового поколения
«Ваш AI забывает всё между разговорами. Supermemory это исправляет.»
Любой разработчик, строивший AI-продукт на базе LLM, сталкивался с одной и той же проблемой: модель не помнит ничего из предыдущих сессий. Каждый новый диалог — чистый лист. Именно эту боль и решает Supermemory — инфраструктурный слой памяти для AI-приложений и агентов.
Что такое Supermemory и для кого он?
Supermemory — это одновременно движок памяти (Memory Engine) и готовое приложение, которое позиционируется как «Memory API для эпохи AI». Проект опубликован на GitHub с открытым исходным кодом под лицензией Apache 2.0 и набрал более 22 500 звёзд и 2 100 форков.
По сути, это управляемый контекстный стек для LLM: система автоматически извлекает факты из разговоров, строит профиль пользователя, обрабатывает изменения и противоречия и возвращает нужный контекст в нужный момент.
Для кого предназначен:
- Разработчиков AI-агентов и чат-ботов
- Команд, создающих персонализированные AI-продукты
- Энтерпрайз-команд, которым нужна масштабируемая память с SOC 2-совместимостью
- Исследователей и стартапов, которым нужна быстрая интеграция без построения RAG-пайплайна с нуля
Архитектура: как это работает
graph TD
A[Ваше AI-приложение / агент] --> B[Supermemory API]
B --> C[Memory Engine]
B --> D[User Profiles]
B --> E[Hybrid Search: RAG + Memory]
B --> F[Connectors]
B --> G[File Processing]
C --> C1[Извлечение фактов из диалогов]
C --> C2[Отслеживание изменений и противоречий]
C --> C3[Автоматическое забывание устаревших данных]
D --> D1[Статичные факты]
D --> D2[Динамический контекст]
F --> F1[Google Drive / Gmail]
F --> F2[Notion / OneDrive / GitHub]
G --> G1[PDF / Изображения / Видео / Код]
Архитектура Supermemory включает пять взаимосвязанных уровней:
- Memory Engine — автоматически учится на диалогах, извлекает факты, отслеживает изменения и разрешает противоречия, удаляет устаревшую информацию.
- User Profiles — поддерживает стабильные факты и недавнюю активность. Один API-вызов занимает ~50 мс.
- Hybrid Search — RAG и персонализированная память одновременно в одном запросе.
- Connectors — автосинхронизация из Google Drive, Gmail, Notion, OneDrive, GitHub с реалтайм-вебхуками.
- File Processing — обработка PDF, изображений (OCR), видео (транскрипция), кода (AST-aware chunking).
Ключевые возможности
1. Сверхбыстрый поиск по памяти
Latency — одна из сильных сторон Supermemory. Система обеспечивает sub-300ms P50-задержку, что делает её пригодной для использования в агентных циклах реального времени.
2. Дедупликация токенов
Billing ведётся в «SM-токенах» — уникальных токенах, которые система действительно обрабатывает. Повторная загрузка одного и того же документа, синхронизация коннектора или отправка той же истории диалогов не снимают средства с баланса. Это делает Supermemory значительно дешевле стандартных векторных БД в продакшн-агентах, которые многократно обращаются к одному контексту.
3. MCP-интеграция
Supermemory поддерживает Model Context Protocol. Интеграция с Claude Desktop, Cursor, VS Code, Claude Code, OpenCode и другими клиентами происходит буквально одной командой:
{
"mcpServers": {
"supermemory": {
"url": "https://mcp.supermemory.ai/mcp",
"headers": {
"Authorization": "Bearer sm_your_api_key_here"
}
}
}
}
4. TypeScript и Python SDK
SDK доступны как на npm, так и на PyPI. Вот минимальный пример работы с TypeScript SDK:
import Supermemory from 'supermemory';
const client = new Supermemory();
// Сохранить воспоминание
await client.add({
content: "Пользователь предпочитает TypeScript и функциональный стиль",
containerTag: "user_123",
});
// Получить профиль + релевантные воспоминания одним вызовом
const { profile, searchResults } = await client.profile({
containerTag: "user_123",
q: "Какой стиль программирования предпочитает пользователь?",
});
Аналог на Python:
from supermemory import Supermemory
client = Supermemory()
client.memories.add(
content="Пользователь работает в сфере ML и предпочитает краткие ответы",
)
results = client.search.documents(q="предпочтения пользователя")
print(results)
5. Граф-ориентированная память vs. обычный RAG
Традиционный RAG возвращает статичные чанки документов — одинаково для всех пользователей. Supermemory извлекает и отслеживает факты о конкретном пользователе во времени. Например, если пользователь написал «я только что переехал в Москву», это автоматически заменяет запись «живёт в Санкт-Петербурге». RAG и персонализированная память работают вместе в одном запросе по умолчанию.
@supermemory/tools/ai-sdk. Это рекомендуемый способ для новых проектов.6. Плагины для AI-кодировщиков
Supermemory поставляется со встроенными плагинами для Claude Code, OpenCode, Cursor и других AI-кодировщиков. Достаточно сказать «запомни, что этот проект использует Bun» — и агент сохраняет это в памяти. При следующем запросе эта информация автоматически инжектируется в контекст без каких-либо ручных действий.
Тарифы и цены
Система тарификации у Supermemory нестандартная: каждый тарифный план включает ежемесячный долларовый баланс, из которого списываются средства по мере API-вызовов (хранение, поиск, индексация).
| Тариф | Цена | Объём | Подходит для |
|---|---|---|---|
| Free | $0/мес | Ограниченный баланс | Разработка и эксперименты |
| Pro | $19/мес | ~3M токенов | Большинство команд и MVP |
| Scale | $399/мес | Энтерпрайз-объёмы | Крупные продакшн-нагрузки |
| Enterprise | По запросу | Custom | Выделенная поддержка, SLA, air-gap |
Важные детали биллинга:
- Повторная загрузка контента не тарифицируется — только уникальные токены.
- Plain text — $0.005 за 1K SM-токенов; rich content (PDF, аудио, видео) — $0.010 за 1K.
- На Scale можно установить лимиты трат, чтобы избежать перерасхода.
- Self-hosted деплой доступен на Scale и Enterprise.
- Стартап-программа: $1 000 в Pro-кредитах на 6 месяцев для квалифицированных early-stage проектов.
- Для академических исследований — production-grade память бесплатно.
Плюсы и минусы
| ✅ Плюсы | ❌ Минусы |
|---|---|
| Sub-300ms латентность поиска | Не no-code инструмент — нужен API-опыт |
| Дедупликация токенов = экономия бюджета | Закрытый исходный код для self-hosted версии (Enterprise) |
| RAG + Memory в одном запросе | Меньше возможностей для сложных временны́х графов, чем у Zep |
| Коннекторы к Notion, Drive, Gmail, GitHub | MCP v1 устарел — нужна миграция на новую версию |
| SOC 2 Type II, GDPR-совместимость | Free-план ограничен по балансу — реальное тестирование требует перехода на Pro |
| TypeScript и Python SDK, поддержка Bun/Edge/Workers | Нет визуального no-code построителя |
| Плагины для Claude Code, Cursor, VS Code | Сравнительно молодой проект — экосистема ещё формируется |
| Стартап-программа и академические гранты | — |
Сравнение с альтернативами
Главные конкуренты Supermemory в нише «память для AI-агентов» — это Mem0 и Zep.
| Параметр | Supermemory | Mem0 | Zep |
|---|---|---|---|
| Архитектура | Vector + граф-память + RAG | Vector DB + Knowledge Graph | Temporal Knowledge Graph |
| Латентность | Sub-300ms P50 | Sub-second | Sub-second |
| Free-тариф | Есть | Есть | Есть |
| Базовая цена | $19/мес (Pro) | $249/мес (Pro с графом) | Зависит от плана |
| Граф-функции | В базовом плане | Только на Pro ($249/мес) | Нативно |
| Темпоральная память | Частичная | Ограниченная | Полная (Graphiti) |
| Self-hosted | Enterprise | Ограниченно | Community Edition |
| SOC 2 | Type II ✅ | Type II ✅ | Есть |
| MCP-поддержка | ✅ Нативная | Ограниченная | Ограниченная |
| Лицензия | Apache 2.0 (open app) | Open-source | Open-source (community) |
| Лучше всего для | Быстрая интеграция, Claude Code | Крупная экосистема, Python/JS | Темпоральный граф, энтерпрайз |
Когда выбрать Supermemory:
- Нужна наименьшая задержка и самое простое подключение.
- Проект строится на Claude Code, Cursor или другом AI-кодировщике.
- Нужны граф-функции, но бюджет не позволяет платить $249/мес за Mem0 Pro.
- Важна единая система для RAG, памяти и профилей без дополнительных интеграций.
Когда выбрать Mem0:
- Самая большая экосистема и обширные SDK-интеграции приоритетнее всего.
- Команда работает преимущественно на Python.
Когда выбрать Zep:
- Проект требует глубокой темпоральной памяти и отслеживания изменений факта во времени.
- Приоритет — сложные энтерпрайз-воркфлоу с мультисистемной интеграцией данных.
Вердикт
Подходит: разработчикам AI-агентов, стартапам, командам на Claude Code / Cursor, тем, кто ищет самую низкую латентность и простую интеграцию без построения пайплайна с нуля.
Не подходит: нетехническим пользователям без опыта работы с API, проектам с требованиями глубокой темпоральной памяти или строгой суверенности данных (без Enterprise-плана).
Supermemory — зрелый выбор для разработчиков, которые хотят добавить долгосрочную память в свои AI-продукты с минимальным трением. Конкурентное преимущество — это сочетание sub-300ms латентности, дедупликации токенов (что снижает реальные затраты) и нативной поддержки MCP для AI-кодировщиков. Отставание от Zep в темпоральных граф-функциях компенсируется значительно более низкой ценой и скоростью первого деплоя.
Рейтинг: 8.5 / 10
С чего начать?
Если вы готовы попробовать Supermemory в своём проекте, путь прост:
- Получите API-ключ на app.supermemory.ai
- Установите SDK:
npm install supermemoryилиpip install supermemory - Подключите MCP-сервер к вашему AI-кодировщику (Cursor, Claude Code, VS Code) за одну команду
- Изучите документацию и примеры на docs.supermemory.ai
- Если вы стартап — подайте заявку в Startup Program и получите $1 000 в Pro-кредитах на 6 месяцев
Агентская эра требует агентской памяти. Supermemory — один из наиболее зрелых и доступных способов её добавить уже сегодня.