Глоссарий on AI-Uchi — Всё об искусственном интеллекте

Контекстное окно (Context Window)

Mon, 13 Apr 2026 09:00:00 +0300

Контекстное окно (Context Window)

Определение простыми словами

Контекстное окно — это «рабочая память» языковой модели: всё, что она может «видеть» и учитывать в один момент времени. Чем больше окно — тем больше текста модель держит в голове одновременно.

Представьте, что вы разговариваете с очень умным консультантом, но у него есть одно ограничение: он помнит только последние N страниц вашего разговора. Всё, что было до — для него как будто не существует. Именно так работает контекстное окно.

Эмбеддинг (Embedding)

Thu, 02 Apr 2026 09:00:00 +0300

ℹ Info

Эмбеддинг (Embedding) — числовое представление данных (текста, изображения, аудио) в виде вектора фиксированной длины. Близкие по смыслу объекты получают близкие векторы, что позволяет машине «понимать» семантическое сходство — не по совпадению слов, а по значению.

Зачем нужны эмбеддинги

Компьютер не понимает слова — он работает с числами. Классический подход — поиск по ключевым словам — ломается, когда человек пишет «недорогой смартфон», а в базе написано «бюджетный телефон». Слова разные, смысл один.

Эмбеддинг (Embedding)

Wed, 01 Apr 2026 15:00:00 +0300

Что такое эмбеддинг?

ℹ Info

Эмбеддинг (embedding) — это способ превратить текст, изображение или другой объект в набор чисел (вектор), который отражает его смысл. Близкие по значению объекты получают похожие векторы, далёкие — различные.

Представьте, что вам нужно объяснить компьютеру, что «кот» и «кошка» — почти одно и то же, а «кот» и «бетономешалка» — совсем разное. Обычный текст для машины — просто набор символов. Эмбеддинг решает эту проблему: он переводит слова и предложения в числовое пространство, где расстояние между точками соответствует смысловой близости.

Галлюцинация (Hallucination)

Mon, 23 Mar 2026 18:00:00 +0300

Галлюцинация (англ. hallucination) — это явление, при котором AI-модель генерирует ответ, содержащий ложную или вымышленную информацию, но подаёт её уверенно и правдоподобно. Модель не «врёт» намеренно — она просто не отличает реальные факты от статистически вероятных последовательностей слов.

ℹ Info

Определение. AI-галлюцинация — ответ модели, который звучит убедительно, но содержит вымышленные факты, несуществующие источники или искажённые данные. Термин заимствован из психиатрии по аналогии: модель «видит» то, чего нет.

Почему модели галлюцинируют

Большие языковые модели (LLM) — это предсказатели следующего слова. Они обучены находить статистические закономерности в текстах, а не хранить базу фактов. Когда модель сталкивается с пробелом в знаниях или неоднозначным запросом, она заполняет пустоту наиболее правдоподобной выдумкой — вместо того чтобы признать незнание.

Галлюцинация (Hallucination)

Sun, 15 Mar 2026 12:00:00 +0300

Определение

ℹ Info

Галлюцинация ИИ — это ответ модели, который содержит ложную или вымышленную информацию, но подаётся уверенно и убедительно, как установленный факт. Модель не «врёт» намеренно — она предсказывает наиболее вероятное продолжение текста, и иногда это продолжение оказывается выдумкой.

Языковые модели (LLM) работают как продвинутые автодополнители: они генерируют текст слово за словом, выбирая статистически правдоподобные варианты. У них нет встроенного понимания «истинности» — только паттерны из обучающих данных. Когда паттернов недостаточно или вопрос выходит за рамки обучения, модель заполняет пробелы правдоподобной, но ложной информацией.

Mixture of Experts — MoE (Смесь экспертов)

Sat, 07 Mar 2026 12:00:00 +0300

ℹ Info

Mixture of Experts (MoE) — архитектура нейронной сети, в которой вместо одной большой сети используется набор специализированных «экспертов». Для каждого входного токена специальный маршрутизатор (router) выбирает лишь несколько экспертов из всего набора — остальные в обработке не участвуют.

Зачем это нужно

Классическая (плотная) языковая модель обрабатывает каждый токен через все свои параметры целиком. Это честно, но расточительно: слово «кот» не требует тех же нейронов, что слово «интеграл». MoE решает эту проблему элегантно — модель становится огромной на бумаге, но «думает» компактно.

RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)

Sat, 07 Mar 2026 09:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — это метод, при котором языковая модель перед генерацией ответа сначала находит релевантную информацию во внешней базе знаний и использует её как контекст. Это позволяет давать точные, актуальные и проверяемые ответы без переобучения модели.

Зачем нужен RAG

Большие языковые модели (LLM) обучены на огромных массивах текста, но у них есть два фундаментальных ограничения: знания «заморожены» на дату обучения и они не имеют доступа к закрытым корпоративным данным. RAG решает обе проблемы — модель получает свежую и специфичную информацию прямо в момент запроса.

RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)

Fri, 06 Mar 2026 18:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — подход, при котором языковая модель перед генерацией ответа сначала ищет релевантную информацию во внешней базе знаний и использует найденное как контекст. Это делает ответы точнее, актуальнее и проверяемее.

Зачем нужен RAG

Большие языковые модели (LLM) обучаются на огромных корпусах текстов, но их знания «заморожены» на дату обучения. Они не знают о вчерашних событиях, внутренних документах вашей компании или специфичных данных вашей отрасли. Кроме того, LLM склонны к галлюцинациям — уверенной генерации несуществующих фактов.

RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)

Sun, 01 Mar 2026 15:00:00 +0300

Определение

ℹ Info

RAG (Retrieval-Augmented Generation) — это архитектурный паттерн, при котором языковая модель перед генерацией ответа сначала находит релевантные документы во внешней базе знаний и использует их как контекст. Проще говоря: модель не полагается только на свою «память», а подглядывает в шпаргалку с актуальными данными.

Термин ввели исследователи из Meta AI (Facebook) в 2020 году в статье «Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks», представленной на конференции NeurIPS 2020.

Как это работает

RAG-система работает в три шага:

RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)

Sat, 28 Feb 2026 09:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — подход, при котором языковая модель сначала находит релевантные документы во внешней базе знаний и только потом генерирует ответ, опираясь на найденную информацию. Это позволяет модели «знать» то, чего не было в её обучающих данных.

Зачем нужен RAG

У любой LLM есть две фундаментальные проблемы: она не знает ваших данных и может галлюцинировать — уверенно выдавать несуществующие факты. Fine-tuning решает первую проблему лишь частично и стоит дорого. RAG предлагает элегантный выход: вместо того чтобы переучивать модель, мы подаём ей нужный контекст прямо в запросе.

RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)

Thu, 26 Feb 2026 12:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — подход, при котором языковая модель перед генерацией ответа сначала находит релевантную информацию во внешних источниках данных и использует её как контекст. Это позволяет давать точные, актуальные и проверяемые ответы без переобучения самой модели.

Простыми словами

Представьте студента на экзамене. Обычная LLM — это студент, который отвечает только по памяти: что выучил, то и говорит, а если не помнит — может начать выдумывать. RAG — это тот же студент, но с открытым учебником: прежде чем ответить, он находит нужную страницу, читает и только потом формулирует ответ.

RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)

Fri, 20 Feb 2026 18:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — техника, при которой языковая модель сначала находит релевантные документы во внешней базе знаний и только потом генерирует ответ, опираясь на найденную информацию. Это позволяет модели давать точные, актуальные и проверяемые ответы — даже по данным, которых не было в её обучающей выборке.

Зачем нужен RAG

Большие языковые модели (LLM) обучаются на огромных массивах текста, но у них есть два системных ограничения:

Знания устаревают — модель ничего не знает о событиях после даты обучения.
Галлюцинации — модель может уверенно генерировать правдоподобный, но полностью выдуманный ответ.

RAG решает обе проблемы: вместо того чтобы полагаться только на «память» модели, система подключает к ней внешний источник актуальных данных — корпоративную wiki, базу документов, API или векторную базу данных.

Mixture of Experts (MoE)

Thu, 19 Feb 2026 15:00:00 +0300

ℹ Info

Mixture of Experts (MoE) — архитектура языковой модели, в которой вместо одного монолитного блока используется набор специализированных подсетей («экспертов»). При обработке каждого токена активируется лишь небольшая часть экспертов, что снижает вычислительную нагрузку без потери качества.

Простыми словами

Представьте большую редакцию с сотней специалистов: юристы, экономисты, переводчики, программисты. Когда поступает задача, её не решают все сразу — её направляют к двум-трём подходящим экспертам. Остальные в это время свободны.

MoE работает точно так же. Модель содержит десятки или сотни «экспертных» слоёв, но на каждый токен активируются только несколько из них. Специальный компонент — роутер (gating network) — решает, кому передать слово.

Промпт-инжиниринг (Prompt Engineering)

Thu, 19 Feb 2026 12:00:00 +0300

ℹ Info

Промпт-инжиниринг (Prompt Engineering) — искусство и практика составления запросов (промптов) к языковым моделям таким образом, чтобы получать максимально точные, полезные и релевантные ответы. Это не программирование в привычном смысле, а скорее умение правильно формулировать задачу для ИИ.

Зачем это нужно

Одна и та же языковая модель может дать блестящий или бесполезный ответ — всё зависит от того, как сформулирован запрос. Промпт-инжиниринг — это набор техник, которые помогают «раскрыть» возможности модели без изменения её весов или архитектуры.

RAG — генерация с дополненной выборкой (Retrieval-Augmented Generation)

Tue, 17 Feb 2026 15:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — это метод, при котором языковая модель сначала находит релевантные документы во внешней базе знаний, а затем генерирует ответ на их основе. Проще говоря: вместо того чтобы отвечать «по памяти», модель сначала «подсматривает в шпаргалку».

Зачем это нужно

Большие языковые модели (LLM) обучаются на огромных объёмах текста, но их знания заморожены на момент обучения. Они не знают о вчерашних событиях, не имеют доступа к вашим внутренним документам и иногда уверенно выдумывают факты — это называется «галлюцинации».

Mixture of Experts — MoE (Смесь экспертов)

Tue, 17 Feb 2026 12:00:00 +0300

ℹ Info

Mixture of Experts (MoE) — архитектура языковых моделей, в которой вместо одного большого блока вычислений используется набор специализированных «экспертных» подсетей. При обработке каждого токена активируется лишь небольшая часть экспертов — остальные «молчат». Модель остаётся огромной по числу параметров, но дешёвой в работе.

Что такое Mixture of Experts простыми словами

Представьте больницу, где работают узкие специалисты: терапевт, кардиолог, невролог. Когда к ним приходит пациент, его направляют к одному-двум нужным врачам, а не ко всем сразу. Это быстро, точно и экономично.

RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)

Sat, 14 Feb 2026 12:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — это архитектурный паттерн, при котором языковая модель перед генерацией ответа сначала ищет релевантную информацию во внешних источниках и использует её как контекст. Проще говоря, модель не полагается только на свою «память» — она сначала «заглядывает в справочник», а потом отвечает.

Зачем это нужно

Большие языковые модели (LLM) обучены на огромных объёмах текста, но их знания заморожены на момент обучения. Они не знают о вчерашних событиях, не имеют доступа к вашим внутренним документам и иногда уверенно выдумывают факты — это называется галлюцинациями.

ИИ-агенты (AI Agents)

Thu, 12 Feb 2026 12:00:00 +0300

ℹ Info

ИИ-агент (AI Agent) — это программная система на базе искусственного интеллекта, которая способна самостоятельно планировать последовательность действий, использовать внешние инструменты и адаптировать своё поведение для достижения поставленной цели — без пошагового управления со стороны человека.

Чем агент отличается от обычного чат-бота

Обычный чат-бот работает в формате «вопрос → ответ»: вы пишете промпт, модель генерирует текст. ИИ-агент устроен иначе. Он получает цель, а не инструкцию, и сам определяет, какие шаги нужно предпринять. Если один шаг не сработал, агент пересматривает план и пробует другой подход.

Mixture of Experts — MoE (Смесь экспертов)

Tue, 10 Feb 2026 09:00:00 +0300

ℹ Info

Mixture of Experts (MoE) — архитектура нейросети, в которой большая модель разбита на множество специализированных подсетей («экспертов»). При обработке каждого запроса активируется лишь небольшая часть этих экспертов — та, что наиболее подходит для задачи. Остальные в работе не участвуют.

Что такое MoE простыми словами

Представьте компанию, в которой работают сотни узких специалистов: юристы, программисты, дизайнеры, финансисты. Когда клиент приходит с задачей, менеджер (он же «роутер») оценивает вопрос и направляет его к двум-трём нужным специалистам. Остальные сотрудники в этот момент отдыхают.

RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)

Mon, 09 Feb 2026 09:00:00 +0300

ℹ Info

RAG (Retrieval-Augmented Generation) — подход, при котором языковая модель перед генерацией ответа сначала ищет релевантную информацию во внешней базе знаний. Это позволяет давать точные, актуальные ответы без необходимости переобучать модель.

Зачем нужен RAG

Большие языковые модели (LLM) обучены на огромных массивах текста, но у них есть два фундаментальных ограничения: знания «заморожены» на момент обучения, и модель может уверенно выдавать ложную информацию — так называемые галлюцинации.

RAG решает обе проблемы. Вместо того чтобы полагаться только на «память» модели, система сначала находит нужные документы и подставляет их в контекст запроса. Модель отвечает, опираясь на конкретные источники, а не на догадки.