Supermemory: Memory API для AI-агентов нового поколения

Supermemory — Memory API для AI-агентов: быстрый и масштабируемый движок памяти

«Ваш AI забывает всё между разговорами. Supermemory это исправляет.»

Любой разработчик, строивший AI-продукт на базе LLM, сталкивался с одной и той же проблемой: модель не помнит ничего из предыдущих сессий. Каждый новый диалог — чистый лист. Именно эту боль и решает Supermemory — инфраструктурный слой памяти для AI-приложений и агентов.


Что такое Supermemory и для кого он?

Supermemory — это одновременно движок памяти (Memory Engine) и готовое приложение, которое позиционируется как «Memory API для эпохи AI». Проект опубликован на GitHub с открытым исходным кодом под лицензией Apache 2.0 и набрал более 22 500 звёзд и 2 100 форков.

По сути, это управляемый контекстный стек для LLM: система автоматически извлекает факты из разговоров, строит профиль пользователя, обрабатывает изменения и противоречия и возвращает нужный контекст в нужный момент.

Для кого предназначен:

  • Разработчиков AI-агентов и чат-ботов
  • Команд, создающих персонализированные AI-продукты
  • Энтерпрайз-команд, которым нужна масштабируемая память с SOC 2-совместимостью
  • Исследователей и стартапов, которым нужна быстрая интеграция без построения RAG-пайплайна с нуля
ℹ Ключевой тезис
Supermemory — это не просто база данных. Это полноценный контекстный слой: RAG + память + профили пользователей + коннекторы в одной системе и одном API-вызове.

Архитектура: как это работает


graph TD
    A[Ваше AI-приложение / агент] --> B[Supermemory API]
    B --> C[Memory Engine]
    B --> D[User Profiles]
    B --> E[Hybrid Search: RAG + Memory]
    B --> F[Connectors]
    B --> G[File Processing]
    C --> C1[Извлечение фактов из диалогов]
    C --> C2[Отслеживание изменений и противоречий]
    C --> C3[Автоматическое забывание устаревших данных]
    D --> D1[Статичные факты]
    D --> D2[Динамический контекст]
    F --> F1[Google Drive / Gmail]
    F --> F2[Notion / OneDrive / GitHub]
    G --> G1[PDF / Изображения / Видео / Код]

Архитектура Supermemory включает пять взаимосвязанных уровней:

  1. Memory Engine — автоматически учится на диалогах, извлекает факты, отслеживает изменения и разрешает противоречия, удаляет устаревшую информацию.
  2. User Profiles — поддерживает стабильные факты и недавнюю активность. Один API-вызов занимает ~50 мс.
  3. Hybrid Search — RAG и персонализированная память одновременно в одном запросе.
  4. Connectors — автосинхронизация из Google Drive, Gmail, Notion, OneDrive, GitHub с реалтайм-вебхуками.
  5. File Processing — обработка PDF, изображений (OCR), видео (транскрипция), кода (AST-aware chunking).

Ключевые возможности

1. Сверхбыстрый поиск по памяти

Latency — одна из сильных сторон Supermemory. Система обеспечивает sub-300ms P50-задержку, что делает её пригодной для использования в агентных циклах реального времени.

2. Дедупликация токенов

Billing ведётся в «SM-токенах» — уникальных токенах, которые система действительно обрабатывает. Повторная загрузка одного и того же документа, синхронизация коннектора или отправка той же истории диалогов не снимают средства с баланса. Это делает Supermemory значительно дешевле стандартных векторных БД в продакшн-агентах, которые многократно обращаются к одному контексту.

3. MCP-интеграция

Supermemory поддерживает Model Context Protocol. Интеграция с Claude Desktop, Cursor, VS Code, Claude Code, OpenCode и другими клиентами происходит буквально одной командой:

{
  "mcpServers": {
    "supermemory": {
      "url": "https://mcp.supermemory.ai/mcp",
      "headers": {
        "Authorization": "Bearer sm_your_api_key_here"
      }
    }
  }
}

4. TypeScript и Python SDK

SDK доступны как на npm, так и на PyPI. Вот минимальный пример работы с TypeScript SDK:

import Supermemory from 'supermemory';

const client = new Supermemory();

// Сохранить воспоминание
await client.add({
  content: "Пользователь предпочитает TypeScript и функциональный стиль",
  containerTag: "user_123",
});

// Получить профиль + релевантные воспоминания одним вызовом
const { profile, searchResults } = await client.profile({
  containerTag: "user_123",
  q: "Какой стиль программирования предпочитает пользователь?",
});

Аналог на Python:

from supermemory import Supermemory

client = Supermemory()

client.memories.add(
    content="Пользователь работает в сфере ML и предпочитает краткие ответы",
)

results = client.search.documents(q="предпочтения пользователя")
print(results)

5. Граф-ориентированная память vs. обычный RAG

Традиционный RAG возвращает статичные чанки документов — одинаково для всех пользователей. Supermemory извлекает и отслеживает факты о конкретном пользователе во времени. Например, если пользователь написал «я только что переехал в Москву», это автоматически заменяет запись «живёт в Санкт-Петербурге». RAG и персонализированная память работают вместе в одном запросе по умолчанию.

💡 Совет разработчику
Если вы используете Vercel AI SDK — для Supermemory есть готовая интеграция через @supermemory/tools/ai-sdk. Это рекомендуемый способ для новых проектов.

6. Плагины для AI-кодировщиков

Supermemory поставляется со встроенными плагинами для Claude Code, OpenCode, Cursor и других AI-кодировщиков. Достаточно сказать «запомни, что этот проект использует Bun» — и агент сохраняет это в памяти. При следующем запросе эта информация автоматически инжектируется в контекст без каких-либо ручных действий.


Тарифы и цены

Система тарификации у Supermemory нестандартная: каждый тарифный план включает ежемесячный долларовый баланс, из которого списываются средства по мере API-вызовов (хранение, поиск, индексация).

ТарифЦенаОбъёмПодходит для
Free$0/месОграниченный балансРазработка и эксперименты
Pro$19/мес~3M токеновБольшинство команд и MVP
Scale$399/месЭнтерпрайз-объёмыКрупные продакшн-нагрузки
EnterpriseПо запросуCustomВыделенная поддержка, SLA, air-gap

Важные детали биллинга:

  • Повторная загрузка контента не тарифицируется — только уникальные токены.
  • Plain text — $0.005 за 1K SM-токенов; rich content (PDF, аудио, видео) — $0.010 за 1K.
  • На Scale можно установить лимиты трат, чтобы избежать перерасхода.
  • Self-hosted деплой доступен на Scale и Enterprise.
  • Стартап-программа: $1 000 в Pro-кредитах на 6 месяцев для квалифицированных early-stage проектов.
  • Для академических исследований — production-grade память бесплатно.
⚠ Важно
На Free-тарифе pay-as-you-go недоступен: при исчерпании баланса приложение приостанавливается. Для продакшн-нагрузок необходим как минимум Pro-план с поддержкой auto top-up.

Плюсы и минусы

✅ Плюсы❌ Минусы
Sub-300ms латентность поискаНе no-code инструмент — нужен API-опыт
Дедупликация токенов = экономия бюджетаЗакрытый исходный код для self-hosted версии (Enterprise)
RAG + Memory в одном запросеМеньше возможностей для сложных временны́х графов, чем у Zep
Коннекторы к Notion, Drive, Gmail, GitHubMCP v1 устарел — нужна миграция на новую версию
SOC 2 Type II, GDPR-совместимостьFree-план ограничен по балансу — реальное тестирование требует перехода на Pro
TypeScript и Python SDK, поддержка Bun/Edge/WorkersНет визуального no-code построителя
Плагины для Claude Code, Cursor, VS CodeСравнительно молодой проект — экосистема ещё формируется
Стартап-программа и академические гранты

Сравнение с альтернативами

Главные конкуренты Supermemory в нише «память для AI-агентов» — это Mem0 и Zep.

ПараметрSupermemoryMem0Zep
АрхитектураVector + граф-память + RAGVector DB + Knowledge GraphTemporal Knowledge Graph
ЛатентностьSub-300ms P50Sub-secondSub-second
Free-тарифЕстьЕстьЕсть
Базовая цена$19/мес (Pro)$249/мес (Pro с графом)Зависит от плана
Граф-функцииВ базовом планеТолько на Pro ($249/мес)Нативно
Темпоральная памятьЧастичнаяОграниченнаяПолная (Graphiti)
Self-hostedEnterpriseОграниченноCommunity Edition
SOC 2Type II ✅Type II ✅Есть
MCP-поддержка✅ НативнаяОграниченнаяОграниченная
ЛицензияApache 2.0 (open app)Open-sourceOpen-source (community)
Лучше всего дляБыстрая интеграция, Claude CodeКрупная экосистема, Python/JSТемпоральный граф, энтерпрайз

Когда выбрать Supermemory:

  • Нужна наименьшая задержка и самое простое подключение.
  • Проект строится на Claude Code, Cursor или другом AI-кодировщике.
  • Нужны граф-функции, но бюджет не позволяет платить $249/мес за Mem0 Pro.
  • Важна единая система для RAG, памяти и профилей без дополнительных интеграций.

Когда выбрать Mem0:

  • Самая большая экосистема и обширные SDK-интеграции приоритетнее всего.
  • Команда работает преимущественно на Python.

Когда выбрать Zep:

  • Проект требует глубокой темпоральной памяти и отслеживания изменений факта во времени.
  • Приоритет — сложные энтерпрайз-воркфлоу с мультисистемной интеграцией данных.

Вердикт

📝 Кому подойдёт Supermemory

Подходит: разработчикам AI-агентов, стартапам, командам на Claude Code / Cursor, тем, кто ищет самую низкую латентность и простую интеграцию без построения пайплайна с нуля.

Не подходит: нетехническим пользователям без опыта работы с API, проектам с требованиями глубокой темпоральной памяти или строгой суверенности данных (без Enterprise-плана).

Supermemory — зрелый выбор для разработчиков, которые хотят добавить долгосрочную память в свои AI-продукты с минимальным трением. Конкурентное преимущество — это сочетание sub-300ms латентности, дедупликации токенов (что снижает реальные затраты) и нативной поддержки MCP для AI-кодировщиков. Отставание от Zep в темпоральных граф-функциях компенсируется значительно более низкой ценой и скоростью первого деплоя.

Рейтинг: 8.5 / 10


С чего начать?

Если вы готовы попробовать Supermemory в своём проекте, путь прост:

  1. Получите API-ключ на app.supermemory.ai
  2. Установите SDK: npm install supermemory или pip install supermemory
  3. Подключите MCP-сервер к вашему AI-кодировщику (Cursor, Claude Code, VS Code) за одну команду
  4. Изучите документацию и примеры на docs.supermemory.ai
  5. Если вы стартап — подайте заявку в Startup Program и получите $1 000 в Pro-кредитах на 6 месяцев

Агентская эра требует агентской памяти. Supermemory — один из наиболее зрелых и доступных способов её добавить уже сегодня.