Supermemory: Memory API для AI-агентов нового поколения

Supermemory — Memory API для AI-агентов: быстрый и масштабируемый движок памяти

«Ваш AI забывает всё между разговорами. Supermemory это исправляет.»

Любой разработчик, строивший AI-продукт на базе LLM, сталкивался с одной и той же проблемой: модель не помнит ничего из предыдущих сессий. Каждый новый диалог — чистый лист. Именно эту боль и решает Supermemory — инфраструктурный слой памяти для AI-приложений и агентов.

Что такое Supermemory и для кого он?

Supermemory — это одновременно движок памяти (Memory Engine) и готовое приложение, которое позиционируется как «Memory API для эпохи AI». Проект опубликован на GitHub с открытым исходным кодом под лицензией Apache 2.0 и набрал более 22 500 звёзд и 2 100 форков.

По сути, это управляемый контекстный стек для LLM: система автоматически извлекает факты из разговоров, строит профиль пользователя, обрабатывает изменения и противоречия и возвращает нужный контекст в нужный момент.

Для кого предназначен:

Разработчиков AI-агентов и чат-ботов
Команд, создающих персонализированные AI-продукты
Энтерпрайз-команд, которым нужна масштабируемая память с SOC 2-совместимостью
Исследователей и стартапов, которым нужна быстрая интеграция без построения RAG-пайплайна с нуля

ℹ Ключевой тезис

Supermemory — это не просто база данных. Это полноценный контекстный слой: RAG + память + профили пользователей + коннекторы в одной системе и одном API-вызове.

Архитектура: как это работает


graph TD
    A[Ваше AI-приложение / агент] --> B[Supermemory API]
    B --> C[Memory Engine]
    B --> D[User Profiles]
    B --> E[Hybrid Search: RAG + Memory]
    B --> F[Connectors]
    B --> G[File Processing]
    C --> C1[Извлечение фактов из диалогов]
    C --> C2[Отслеживание изменений и противоречий]
    C --> C3[Автоматическое забывание устаревших данных]
    D --> D1[Статичные факты]
    D --> D2[Динамический контекст]
    F --> F1[Google Drive / Gmail]
    F --> F2[Notion / OneDrive / GitHub]
    G --> G1[PDF / Изображения / Видео / Код]

Архитектура Supermemory включает пять взаимосвязанных уровней:

Memory Engine — автоматически учится на диалогах, извлекает факты, отслеживает изменения и разрешает противоречия, удаляет устаревшую информацию.
User Profiles — поддерживает стабильные факты и недавнюю активность. Один API-вызов занимает ~50 мс.
Hybrid Search — RAG и персонализированная память одновременно в одном запросе.
Connectors — автосинхронизация из Google Drive, Gmail, Notion, OneDrive, GitHub с реалтайм-вебхуками.
File Processing — обработка PDF, изображений (OCR), видео (транскрипция), кода (AST-aware chunking).

Ключевые возможности

1. Сверхбыстрый поиск по памяти

Latency — одна из сильных сторон Supermemory. Система обеспечивает sub-300ms P50-задержку, что делает её пригодной для использования в агентных циклах реального времени.

2. Дедупликация токенов

Billing ведётся в «SM-токенах» — уникальных токенах, которые система действительно обрабатывает. Повторная загрузка одного и того же документа, синхронизация коннектора или отправка той же истории диалогов не снимают средства с баланса. Это делает Supermemory значительно дешевле стандартных векторных БД в продакшн-агентах, которые многократно обращаются к одному контексту.

3. MCP-интеграция

Supermemory поддерживает Model Context Protocol. Интеграция с Claude Desktop, Cursor, VS Code, Claude Code, OpenCode и другими клиентами происходит буквально одной командой:

{
  "mcpServers": {
    "supermemory": {
      "url": "https://mcp.supermemory.ai/mcp",
      "headers": {
        "Authorization": "Bearer sm_your_api_key_here"
      }
    }
  }
}

4. TypeScript и Python SDK

SDK доступны как на npm, так и на PyPI. Вот минимальный пример работы с TypeScript SDK:

import Supermemory from 'supermemory';

const client = new Supermemory();

// Сохранить воспоминание
await client.add({
  content: "Пользователь предпочитает TypeScript и функциональный стиль",
  containerTag: "user_123",
});

// Получить профиль + релевантные воспоминания одним вызовом
const { profile, searchResults } = await client.profile({
  containerTag: "user_123",
  q: "Какой стиль программирования предпочитает пользователь?",
});

Аналог на Python:

from supermemory import Supermemory

client = Supermemory()

client.memories.add(
    content="Пользователь работает в сфере ML и предпочитает краткие ответы",
)

results = client.search.documents(q="предпочтения пользователя")
print(results)

5. Граф-ориентированная память vs. обычный RAG

Традиционный RAG возвращает статичные чанки документов — одинаково для всех пользователей. Supermemory извлекает и отслеживает факты о конкретном пользователе во времени. Например, если пользователь написал «я только что переехал в Москву», это автоматически заменяет запись «живёт в Санкт-Петербурге». RAG и персонализированная память работают вместе в одном запросе по умолчанию.

💡 Совет разработчику

Если вы используете Vercel AI SDK — для Supermemory есть готовая интеграция через @supermemory/tools/ai-sdk. Это рекомендуемый способ для новых проектов.

6. Плагины для AI-кодировщиков

Supermemory поставляется со встроенными плагинами для Claude Code, OpenCode, Cursor и других AI-кодировщиков. Достаточно сказать «запомни, что этот проект использует Bun» — и агент сохраняет это в памяти. При следующем запросе эта информация автоматически инжектируется в контекст без каких-либо ручных действий.

Тарифы и цены

Система тарификации у Supermemory нестандартная: каждый тарифный план включает ежемесячный долларовый баланс, из которого списываются средства по мере API-вызовов (хранение, поиск, индексация).

Тариф	Цена	Объём	Подходит для
Free	$0/мес	Ограниченный баланс	Разработка и эксперименты
Pro	$19/мес	~3M токенов	Большинство команд и MVP
Scale	$399/мес	Энтерпрайз-объёмы	Крупные продакшн-нагрузки
Enterprise	По запросу	Custom	Выделенная поддержка, SLA, air-gap

Важные детали биллинга:

Повторная загрузка контента не тарифицируется — только уникальные токены.
Plain text — $0.005 за 1K SM-токенов; rich content (PDF, аудио, видео) — $0.010 за 1K.
На Scale можно установить лимиты трат, чтобы избежать перерасхода.
Self-hosted деплой доступен на Scale и Enterprise.
Стартап-программа: $1 000 в Pro-кредитах на 6 месяцев для квалифицированных early-stage проектов.
Для академических исследований — production-grade память бесплатно.

⚠ Важно

На Free-тарифе pay-as-you-go недоступен: при исчерпании баланса приложение приостанавливается. Для продакшн-нагрузок необходим как минимум Pro-план с поддержкой auto top-up.

Плюсы и минусы

✅ Плюсы	❌ Минусы
Sub-300ms латентность поиска	Не no-code инструмент — нужен API-опыт
Дедупликация токенов = экономия бюджета	Закрытый исходный код для self-hosted версии (Enterprise)
RAG + Memory в одном запросе	Меньше возможностей для сложных временны́х графов, чем у Zep
Коннекторы к Notion, Drive, Gmail, GitHub	MCP v1 устарел — нужна миграция на новую версию
SOC 2 Type II, GDPR-совместимость	Free-план ограничен по балансу — реальное тестирование требует перехода на Pro
TypeScript и Python SDK, поддержка Bun/Edge/Workers	Нет визуального no-code построителя
Плагины для Claude Code, Cursor, VS Code	Сравнительно молодой проект — экосистема ещё формируется
Стартап-программа и академические гранты	—

Сравнение с альтернативами

Главные конкуренты Supermemory в нише «память для AI-агентов» — это Mem0 и Zep.

Параметр	Supermemory	Mem0	Zep
Архитектура	Vector + граф-память + RAG	Vector DB + Knowledge Graph	Temporal Knowledge Graph
Латентность	Sub-300ms P50	Sub-second	Sub-second
Free-тариф	Есть	Есть	Есть
Базовая цена	$19/мес (Pro)	$249/мес (Pro с графом)	Зависит от плана
Граф-функции	В базовом плане	Только на Pro ($249/мес)	Нативно
Темпоральная память	Частичная	Ограниченная	Полная (Graphiti)
Self-hosted	Enterprise	Ограниченно	Community Edition
SOC 2	Type II ✅	Type II ✅	Есть
MCP-поддержка	✅ Нативная	Ограниченная	Ограниченная
Лицензия	Apache 2.0 (open app)	Open-source	Open-source (community)
Лучше всего для	Быстрая интеграция, Claude Code	Крупная экосистема, Python/JS	Темпоральный граф, энтерпрайз

Когда выбрать Supermemory:

Нужна наименьшая задержка и самое простое подключение.
Проект строится на Claude Code, Cursor или другом AI-кодировщике.
Нужны граф-функции, но бюджет не позволяет платить $249/мес за Mem0 Pro.
Важна единая система для RAG, памяти и профилей без дополнительных интеграций.

Когда выбрать Mem0:

Самая большая экосистема и обширные SDK-интеграции приоритетнее всего.
Команда работает преимущественно на Python.

Когда выбрать Zep:

Проект требует глубокой темпоральной памяти и отслеживания изменений факта во времени.
Приоритет — сложные энтерпрайз-воркфлоу с мультисистемной интеграцией данных.

Вердикт

📝 Кому подойдёт Supermemory

Подходит: разработчикам AI-агентов, стартапам, командам на Claude Code / Cursor, тем, кто ищет самую низкую латентность и простую интеграцию без построения пайплайна с нуля.

Не подходит: нетехническим пользователям без опыта работы с API, проектам с требованиями глубокой темпоральной памяти или строгой суверенности данных (без Enterprise-плана).

Supermemory — зрелый выбор для разработчиков, которые хотят добавить долгосрочную память в свои AI-продукты с минимальным трением. Конкурентное преимущество — это сочетание sub-300ms латентности, дедупликации токенов (что снижает реальные затраты) и нативной поддержки MCP для AI-кодировщиков. Отставание от Zep в темпоральных граф-функциях компенсируется значительно более низкой ценой и скоростью первого деплоя.

Рейтинг: 8.5 / 10

С чего начать?

Если вы готовы попробовать Supermemory в своём проекте, путь прост:

Получите API-ключ на app.supermemory.ai
Установите SDK: npm install supermemory или pip install supermemory
Подключите MCP-сервер к вашему AI-кодировщику (Cursor, Claude Code, VS Code) за одну команду
Изучите документацию и примеры на docs.supermemory.ai
Если вы стартап — подайте заявку в Startup Program и получите $1 000 в Pro-кредитах на 6 месяцев

Агентская эра требует агентской памяти. Supermemory — один из наиболее зрелых и доступных способов её добавить уже сегодня.