Cognee: открытая платформа долгосрочной памяти для AI-агентов

«AI Memory — это категория, а не фича» — Vasilije Markovic, CEO Cognee

Что такое Cognee и для кого он предназначен

Cognee — открытая AI-платформа памяти, которая даёт агентам постоянную долгосрочную память между сессиями, объединяя векторные эмбеддинги, граф-рассуждения и онтологию, основанную на когнитивной науке.

Платформа трансформирует сырые данные в структурированные графы знаний через инновационный ECL-конвейер (Extract, Cognify, Load), позволяя AI-системам строить динамическую память, выходящую далеко за пределы традиционных RAG-систем.

Для кого подойдёт:

  • Разработчики AI-агентов и чат-ботов
  • ML-инженеры, строящие мульти-агентные системы
  • Команды, работающие с корпоративными базами знаний
  • Исследователи и стартапы, которым нужен self-hosted контроль данных
  • Компании в регулируемых отраслях (финансы, здравоохранение, юриспруденция)

Сегодня Cognee работает в production более чем в 70 компаниях. В частности, Bayer использует его для поддержки научно-исследовательских рабочих процессов.

ℹ Статистика проекта
Cognee набрал 18 400+ звёзд на GitHub и 2 000+ форков. В 2026 году платформа привлекла $7,5 млн seed-раунда от Pebblebed при поддержке основателей OpenAI и Facebook AI Research.

Архитектура: как устроена память Cognee

Cognee объединяет три слоя хранения данных — реляционный, векторный и граф — в единый движок.


graph TD
    A[Входные данные
PDF, Audio, Images, Slack...] --> B[ECL Pipeline] B --> B1[Extract — извлечение сущностей] B1 --> B2[Cognify — построение графа] B2 --> B3[Load — сохранение в хранилище] B3 --> C[(Граф знаний)] B3 --> D[(Векторное хранилище)] B3 --> E[(Реляционная БД)] C --> F[Recall — запрос агента] D --> F E --> F F --> G[AI-агент получает ответ с контекстом]

Конвейер cognify проходит шесть стадий: классификация документов, проверка прав доступа, извлечение чанков, использование LLM для выделения сущностей и отношений, генерация саммари, затем встраивание всего в векторное хранилище и фиксация рёбер в граф.

memify дополнительно рафинирует граф после загрузки: удаляет устаревшие узлы, усиливает частые связи, перевзвешивает рёбра на основе сигналов использования и добавляет производные факты. Именно здесь происходит самосовершенствование памяти — она не статичное хранилище, а эволюционирующая структура.


Ключевые возможности

1. Простой API: remember / recall / forget / improve

Cognee предоставляет четыре базовые операции — remember, recall, forget и improve:

import cognee
import asyncio

async def main():
    # Сохранить постоянно в граф знаний
    await cognee.remember("Cognee превращает документы в память AI.")

    # Сохранить в сессионную память (быстрый кэш)
    await cognee.remember(
        "Пользователь предпочитает детальные объяснения.",
        session_id="chat_1"
    )

    # Запрос с авто-маршрутизацией
    results = await cognee.recall("Что делает Cognee?")
    for result in results:
        print(result)

asyncio.run(main())

2. Мультиформатная загрузка данных из 30+ источников

Cognee предоставляет 30+ коннекторов для документов, изображений, аудио, Slack, Notion и других источников — конвейер специально создан для извлечения структурированных знаний из разнородных данных.

Поддерживается загрузка любых данных: прошлых разговоров, файлов, изображений, аудио-транскрипций — с заменой традиционных RAG-систем единым слоем памяти на основе графов и векторов.

3. 14 режимов поиска, включая граф-обход

Cognee поставляется с 14 режимами поиска — от классического RAG до цепочечного обхода графа (chain-of-thought graph traversal).

Режим по умолчанию — GRAPH_COMPLETION. Вместо возврата top-k чанков по косинусному сходству он использует векторный поиск как подсказку для поиска релевантных граф-триплетов, а затем обходит граф для построения структурированного контекста перед генерацией ответа.

4. Мультиарендность (Multi-tenancy)

Граф памяти можно создавать отдельно для каждого пользователя, группы или как общий публичный граф. Это не просто разделение пространств имён на уровне векторов — изоляция происходит на уровне графа и трассировки, с разрешениями на уровне датасета (чтение, запись, удаление, публикация).

5. Гибкий выбор бэкенда

Пользователь выбирает графовую СУБД: NetworkX для локальной разработки, Neo4j для production, Kuzu для производительности, FalkorDB для compliance-сред. Можно задавать кастомные онтологии и создавать слои памяти, привязанные к конкретным агентам или доменам.

6. Интеграции с экосистемой AI

Cognee подключается к инструментам, которые команды уже используют: Claude Agent SDK, OpenAI Agents SDK, LangGraph, Google ADK, n8n, Amazon Neptune, Neo4j и другим.

💡 Быстрый старт

Установка занимает одну команду, а память для агента добавляется буквально в 6 строк кода:

pip install cognee
export LLM_API_KEY="your-openai-key"

После этого используйте cognee.remember() и cognee.recall() в вашем агенте.


Реальные примеры использования

Customer Support Agent. Агент отслеживает прошлые взаимодействия, неудавшиеся действия, решённые кейсы и историю продуктов. Когда пользователь жалуется на повторяющуюся проблему, агент находит похожие решённые кейсы, реконструирует хронологию взаимодействий и никогда не повторяет одну и ту же ошибку после выполнения — память обновляется автоматически.

Научные исследования. Организации в регулируемых отраслях получают инструмент для извлечения проверяемых и цитируемых ответов из обширных репозиториев документов. Cognee трансформирует эти документы в верифицируемый граф знаний, позволяя AI-системам давать точные, основанные на фактах ответы.

Образование. Один из пользователей запустил первую систему памяти в течение 30 дней, получив overwhelmingly положительную обратную связь от преподавательской панели.


Тарифные планы

Cognee предлагает три уровня:

ТарифЦенаОписание
Free (OSS)$0/месSelf-hosted, локальное хранение, полный граф знаний
Cloud (Production)$5/tenant/месManaged-инфраструктура, тот же OSS-стек, без платформенного взноса
EnterpriseПо запросуВыделенная поддержка, собственное облако, SLA
💡 Ценовое преимущество
Граф знаний Cognee доступен на каждом тарифе, включая бесплатный self-hosted вариант. Для команд, которым нужен граф при ограниченном бюджете, это структурное ценовое преимущество.

Плюсы и минусы

✅ Плюсы❌ Минусы
Граф знаний доступен на всех тарифах, включая бесплатныйSDK только на Python (нет TypeScript/Go)
Self-hosted с хранением данных локально по умолчаниюБолее высокий порог входа по сравнению с Mem0
14 режимов поиска, включая граф-обходManaged Cloud-сервис относительно новый
Поддержка 30+ форматов данных и источниковТребует LLM-ключ для обработки данных
Мультиарендность с изоляцией на уровне графаПроизводительность ранних версий была медленной
Интеграции с Claude, OpenAI, LangGraph, n8n и др.Документация требует доработки для edge-кейсов
Прошёл GitHub Secure Open Source Program
Самосовершенствующаяся память (memify)

Сравнение с альтернативами

Mem0 и Cognee — два наиболее заметных open-source фреймворка для постоянной памяти агентов, но они подходят к проблеме с разных сторон. Mem0 построил самое большое сообщество благодаря простому API add/search. Cognee создан специально для извлечения структурированных знаний из разнородных источников данных.

ПараметрCogneeMem0Graphlit
ТипOpen-source, self-hosted + CloudOpen-source + SaaSManaged SaaS
Архитектура памятиГраф + Вектор + Реляционная БДВектор + Граф (Pro)Граф + Семантический поиск
Граф знанийНа всех тарифах (бесплатно)Только от $249/месНа всех тарифах
Форматы данных30+ (PDF, audio, images, Slack…)Текст, структурированные данные30+ форматов
Язык SDKPythonPython, JavaScriptREST API
РазвёртываниеЛокально / Docker / CloudCloud / Self-hostedТолько Cloud
Цена (старт)$0 (OSS)$0 (лимитировано)По запросу
КастомизацияВысокая (выбор граф-БД, онтологии)СредняяНизкая

Cognee создан для команд, которым нужны контроль и кастомизация — выбор графовой БД, определение онтологий, запуск собственных конвейеров. Graphlit создан для команд, которым нужна готовая семантическая инфраструктура с первого дня.


Безопасность и зрелость проекта

Cognee успешно прошёл GitHub Secure Open Source Program, что отражает приверженность команды поддержанию высочайших стандартов безопасности и надёжности в открытой AI-инфраструктуре.

Production-grade Python SDK выполняет более одного миллиона конвейеров ежемесячно и принят более чем 70 компаниями, включая Bayer, Университет Вайоминга и dltHub.

⚠ Обратите внимание
Локально-ориентированный дизайн Cognee особенно удобен для air-gapped или офлайн-развёртываний. Однако Python-only SDK ограничивает возможности интеграции для агентных стеков на TypeScript или Go.

Вердикт

Cognee подойдёт, если вы:

  • Строите AI-агентов с долгосрочной памятью и вам нужна максимальная гибкость
  • Работаете с Python и хотите self-hosted решение без vendor lock-in
  • Обрабатываете разнородные данные (документы, аудио, изображения, чаты)
  • Нуждаетесь в мульти-арендности с изоляцией на уровне графа
  • Хотите граф знаний без доплаты — в отличие от конкурентов

Cognee не лучший выбор, если вы:

  • Пишете агентов на TypeScript/Go
  • Хотите полностью managed решение без настройки
  • Ищете максимально простой add/search API без кривой обучения

Итоговый рейтинг

КритерийОценка
Функциональность9/10
Простота использования7/10
Документация7/10
Стоимость / ценность9/10
Экосистема и интеграции8/10
Итог8/10

Cognee — одно из наиболее технически зрелых open-source решений для памяти AI-агентов. Он сочетает граф-векторную архитектуру, самосовершенствующуюся память и enterprise-ready возможности (мультиарендность, трассировка, OTEL) при полной открытости кода. Главное ограничение — Python-only SDK и относительно высокий порог входа по сравнению с более простыми альтернативами.