<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Глоссарий on AI-Uchi — Всё об искусственном интеллекте</title><link>/glossary/</link><description>Recent content in Глоссарий on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Mon, 13 Apr 2026 09:00:00 +0300</lastBuildDate><atom:link href="/glossary/index.xml" rel="self" type="application/rss+xml"/><item><title>Контекстное окно (Context Window)</title><link>/glossary/context-window/</link><pubDate>Mon, 13 Apr 2026 09:00:00 +0300</pubDate><guid>/glossary/context-window/</guid><description>&lt;h1 id="контекстное-окно-context-window"&gt;Контекстное окно (Context Window)&lt;/h1&gt;
&lt;h2 id="определение-простыми-словами"&gt;Определение простыми словами&lt;/h2&gt;
&lt;blockquote&gt;
&lt;p&gt;Контекстное окно — это «рабочая память» языковой модели: всё, что она может «видеть» и учитывать в один момент времени. Чем больше окно — тем больше текста модель держит в голове одновременно.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;Представьте, что вы разговариваете с очень умным консультантом, но у него есть одно ограничение: он помнит только последние N страниц вашего разговора. Всё, что было до — для него как будто не существует. Именно так работает контекстное окно.&lt;/p&gt;</description></item><item><title>Эмбеддинг (Embedding)</title><link>/glossary/embedding-embeddingi/</link><pubDate>Thu, 02 Apr 2026 09:00:00 +0300</pubDate><guid>/glossary/embedding-embeddingi/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Эмбеддинг (Embedding)&lt;/strong&gt; — числовое представление данных (текста, изображения, аудио) в виде вектора фиксированной длины. Близкие по смыслу объекты получают близкие векторы, что позволяет машине «понимать» семантическое сходство — не по совпадению слов, а по значению.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-нужны-эмбеддинги"&gt;Зачем нужны эмбеддинги&lt;/h2&gt;
&lt;p&gt;Компьютер не понимает слова — он работает с числами. Классический подход — поиск по ключевым словам — ломается, когда человек пишет «недорогой смартфон», а в базе написано «бюджетный телефон». Слова разные, смысл один.&lt;/p&gt;</description></item><item><title>Эмбеддинг (Embedding)</title><link>/glossary/embedding-embedding/</link><pubDate>Wed, 01 Apr 2026 15:00:00 +0300</pubDate><guid>/glossary/embedding-embedding/</guid><description>&lt;h2 id="что-такое-эмбеддинг"&gt;Что такое эмбеддинг?&lt;/h2&gt;



&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Эмбеддинг (embedding)&lt;/strong&gt; — это способ превратить текст, изображение или другой объект в набор чисел (вектор), который отражает его смысл. Близкие по значению объекты получают похожие векторы, далёкие — различные.&lt;/div&gt;
&lt;/div&gt;

&lt;p&gt;Представьте, что вам нужно объяснить компьютеру, что «кот» и «кошка» — почти одно и то же, а «кот» и «бетономешалка» — совсем разное. Обычный текст для машины — просто набор символов. Эмбеддинг решает эту проблему: он переводит слова и предложения в числовое пространство, где расстояние между точками соответствует смысловой близости.&lt;/p&gt;</description></item><item><title>Галлюцинация (Hallucination)</title><link>/glossary/galliutsinatsiia-hallucination/</link><pubDate>Mon, 23 Mar 2026 18:00:00 +0300</pubDate><guid>/glossary/galliutsinatsiia-hallucination/</guid><description>&lt;p&gt;&lt;strong&gt;Галлюцинация&lt;/strong&gt; (англ. &lt;em&gt;hallucination&lt;/em&gt;) — это явление, при котором AI-модель генерирует ответ, содержащий ложную или вымышленную информацию, но подаёт её уверенно и правдоподобно. Модель не «врёт» намеренно — она просто не отличает реальные факты от статистически вероятных последовательностей слов.&lt;/p&gt;



&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Определение.&lt;/strong&gt; AI-галлюцинация — ответ модели, который звучит убедительно, но содержит вымышленные факты, несуществующие источники или искажённые данные. Термин заимствован из психиатрии по аналогии: модель «видит» то, чего нет.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="почему-модели-галлюцинируют"&gt;Почему модели галлюцинируют&lt;/h2&gt;
&lt;p&gt;Большие языковые модели (LLM) — это предсказатели следующего слова. Они обучены находить статистические закономерности в текстах, а не хранить базу фактов. Когда модель сталкивается с пробелом в знаниях или неоднозначным запросом, она заполняет пустоту наиболее правдоподобной выдумкой — вместо того чтобы признать незнание.&lt;/p&gt;</description></item><item><title>Галлюцинация (Hallucination)</title><link>/glossary/galliutsinatsiia-hallucination/</link><pubDate>Sun, 15 Mar 2026 12:00:00 +0300</pubDate><guid>/glossary/galliutsinatsiia-hallucination/</guid><description>&lt;h2 id="определение"&gt;Определение&lt;/h2&gt;



&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Галлюцинация ИИ&lt;/strong&gt; — это ответ модели, который содержит ложную или вымышленную информацию, но подаётся уверенно и убедительно, как установленный факт. Модель не «врёт» намеренно — она предсказывает наиболее вероятное продолжение текста, и иногда это продолжение оказывается выдумкой.&lt;/div&gt;
&lt;/div&gt;

&lt;p&gt;Языковые модели (LLM) работают как продвинутые автодополнители: они генерируют текст слово за словом, выбирая статистически правдоподобные варианты. У них нет встроенного понимания «истинности» — только паттерны из обучающих данных. Когда паттернов недостаточно или вопрос выходит за рамки обучения, модель заполняет пробелы правдоподобной, но ложной информацией.&lt;/p&gt;</description></item><item><title>Mixture of Experts — MoE (Смесь экспертов)</title><link>/glossary/mixture-of-experts-moe-smes-ekspertov/</link><pubDate>Sat, 07 Mar 2026 12:00:00 +0300</pubDate><guid>/glossary/mixture-of-experts-moe-smes-ekspertov/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Mixture of Experts (MoE)&lt;/strong&gt; — архитектура нейронной сети, в которой вместо одной большой сети используется набор специализированных «экспертов». Для каждого входного токена специальный маршрутизатор (router) выбирает лишь несколько экспертов из всего набора — остальные в обработке не участвуют.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-это-нужно"&gt;Зачем это нужно&lt;/h2&gt;
&lt;p&gt;Классическая (плотная) языковая модель обрабатывает каждый токен через все свои параметры целиком. Это честно, но расточительно: слово «кот» не требует тех же нейронов, что слово «интеграл». MoE решает эту проблему элегантно — модель становится огромной на бумаге, но «думает» компактно.&lt;/p&gt;</description></item><item><title>RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Sat, 07 Mar 2026 09:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — это метод, при котором языковая модель перед генерацией ответа сначала находит релевантную информацию во внешней базе знаний и использует её как контекст. Это позволяет давать точные, актуальные и проверяемые ответы без переобучения модели.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-нужен-rag"&gt;Зачем нужен RAG&lt;/h2&gt;
&lt;p&gt;Большие языковые модели (LLM) обучены на огромных массивах текста, но у них есть два фундаментальных ограничения: знания «заморожены» на дату обучения и они не имеют доступа к закрытым корпоративным данным. RAG решает обе проблемы — модель получает свежую и специфичную информацию прямо в момент запроса.&lt;/p&gt;</description></item><item><title>RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Fri, 06 Mar 2026 18:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — подход, при котором языковая модель перед генерацией ответа сначала ищет релевантную информацию во внешней базе знаний и использует найденное как контекст. Это делает ответы точнее, актуальнее и проверяемее.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-нужен-rag"&gt;Зачем нужен RAG&lt;/h2&gt;
&lt;p&gt;Большие языковые модели (LLM) обучаются на огромных корпусах текстов, но их знания «заморожены» на дату обучения. Они не знают о вчерашних событиях, внутренних документах вашей компании или специфичных данных вашей отрасли. Кроме того, LLM склонны к &lt;strong&gt;галлюцинациям&lt;/strong&gt; — уверенной генерации несуществующих фактов.&lt;/p&gt;</description></item><item><title>RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Sun, 01 Mar 2026 15:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;h2 id="определение"&gt;Определение&lt;/h2&gt;



&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — это архитектурный паттерн, при котором языковая модель перед генерацией ответа сначала находит релевантные документы во внешней базе знаний и использует их как контекст. Проще говоря: модель не полагается только на свою «память», а подглядывает в шпаргалку с актуальными данными.&lt;/div&gt;
&lt;/div&gt;

&lt;p&gt;Термин ввели исследователи из Meta AI (Facebook) в 2020 году в статье «Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks», представленной на конференции NeurIPS 2020.&lt;/p&gt;
&lt;h2 id="как-это-работает"&gt;Как это работает&lt;/h2&gt;
&lt;p&gt;RAG-система работает в три шага:&lt;/p&gt;</description></item><item><title>RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Sat, 28 Feb 2026 09:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — подход, при котором языковая модель сначала находит релевантные документы во внешней базе знаний и только потом генерирует ответ, опираясь на найденную информацию. Это позволяет модели «знать» то, чего не было в её обучающих данных.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-нужен-rag"&gt;Зачем нужен RAG&lt;/h2&gt;
&lt;p&gt;У любой LLM есть две фундаментальные проблемы: она &lt;strong&gt;не знает ваших данных&lt;/strong&gt; и может &lt;strong&gt;галлюцинировать&lt;/strong&gt; — уверенно выдавать несуществующие факты. Fine-tuning решает первую проблему лишь частично и стоит дорого. RAG предлагает элегантный выход: вместо того чтобы переучивать модель, мы подаём ей нужный контекст прямо в запросе.&lt;/p&gt;</description></item><item><title>RAG — Retrieval-Augmented Generation (генерация с дополненным извлечением)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Thu, 26 Feb 2026 12:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — подход, при котором языковая модель перед генерацией ответа сначала находит релевантную информацию во внешних источниках данных и использует её как контекст. Это позволяет давать точные, актуальные и проверяемые ответы без переобучения самой модели.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="простыми-словами"&gt;Простыми словами&lt;/h2&gt;
&lt;p&gt;Представьте студента на экзамене. Обычная LLM — это студент, который отвечает только по памяти: что выучил, то и говорит, а если не помнит — может начать выдумывать. RAG — это тот же студент, но с открытым учебником: прежде чем ответить, он находит нужную страницу, читает и только потом формулирует ответ.&lt;/p&gt;</description></item><item><title>RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Fri, 20 Feb 2026 18:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — техника, при которой языковая модель сначала находит релевантные документы во внешней базе знаний и только потом генерирует ответ, опираясь на найденную информацию. Это позволяет модели давать точные, актуальные и проверяемые ответы — даже по данным, которых не было в её обучающей выборке.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-нужен-rag"&gt;Зачем нужен RAG&lt;/h2&gt;
&lt;p&gt;Большие языковые модели (LLM) обучаются на огромных массивах текста, но у них есть два системных ограничения:&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;Знания устаревают&lt;/strong&gt; — модель ничего не знает о событиях после даты обучения.&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Галлюцинации&lt;/strong&gt; — модель может уверенно генерировать правдоподобный, но полностью выдуманный ответ.&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;RAG решает обе проблемы: вместо того чтобы полагаться только на «память» модели, система подключает к ней внешний источник актуальных данных — корпоративную wiki, базу документов, API или векторную базу данных.&lt;/p&gt;</description></item><item><title>Mixture of Experts (MoE)</title><link>/glossary/mixture-of-experts-moe/</link><pubDate>Thu, 19 Feb 2026 15:00:00 +0300</pubDate><guid>/glossary/mixture-of-experts-moe/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Mixture of Experts (MoE)&lt;/strong&gt; — архитектура языковой модели, в которой вместо одного монолитного блока используется набор специализированных подсетей («экспертов»). При обработке каждого токена активируется лишь небольшая часть экспертов, что снижает вычислительную нагрузку без потери качества.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="простыми-словами"&gt;Простыми словами&lt;/h2&gt;
&lt;p&gt;Представьте большую редакцию с сотней специалистов: юристы, экономисты, переводчики, программисты. Когда поступает задача, её не решают все сразу — её направляют к двум-трём подходящим экспертам. Остальные в это время свободны.&lt;/p&gt;
&lt;p&gt;MoE работает точно так же. Модель содержит десятки или сотни «экспертных» слоёв, но на каждый токен активируются только несколько из них. Специальный компонент — &lt;strong&gt;роутер&lt;/strong&gt; (gating network) — решает, кому передать слово.&lt;/p&gt;</description></item><item><title>Промпт-инжиниринг (Prompt Engineering)</title><link>/glossary/prompt-inzhiniring-prompt-engineering/</link><pubDate>Thu, 19 Feb 2026 12:00:00 +0300</pubDate><guid>/glossary/prompt-inzhiniring-prompt-engineering/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Промпт-инжиниринг (Prompt Engineering)&lt;/strong&gt; — искусство и практика составления запросов (промптов) к языковым моделям таким образом, чтобы получать максимально точные, полезные и релевантные ответы. Это не программирование в привычном смысле, а скорее умение правильно формулировать задачу для ИИ.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-это-нужно"&gt;Зачем это нужно&lt;/h2&gt;
&lt;p&gt;Одна и та же языковая модель может дать блестящий или бесполезный ответ — всё зависит от того, как сформулирован запрос. Промпт-инжиниринг — это набор техник, которые помогают «раскрыть» возможности модели без изменения её весов или архитектуры.&lt;/p&gt;</description></item><item><title>RAG — генерация с дополненной выборкой (Retrieval-Augmented Generation)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Tue, 17 Feb 2026 15:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — это метод, при котором языковая модель сначала находит релевантные документы во внешней базе знаний, а затем генерирует ответ на их основе. Проще говоря: вместо того чтобы отвечать «по памяти», модель сначала «подсматривает в шпаргалку».&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-это-нужно"&gt;Зачем это нужно&lt;/h2&gt;
&lt;p&gt;Большие языковые модели (LLM) обучаются на огромных объёмах текста, но их знания заморожены на момент обучения. Они не знают о вчерашних событиях, не имеют доступа к вашим внутренним документам и иногда уверенно выдумывают факты — это называется «галлюцинации».&lt;/p&gt;</description></item><item><title>Mixture of Experts — MoE (Смесь экспертов)</title><link>/glossary/mixture-of-experts-moe-smes-ekspertov/</link><pubDate>Tue, 17 Feb 2026 12:00:00 +0300</pubDate><guid>/glossary/mixture-of-experts-moe-smes-ekspertov/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Mixture of Experts (MoE)&lt;/strong&gt; — архитектура языковых моделей, в которой вместо одного большого блока вычислений используется набор специализированных «экспертных» подсетей. При обработке каждого токена активируется лишь небольшая часть экспертов — остальные «молчат». Модель остаётся огромной по числу параметров, но дешёвой в работе.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="что-такое-mixture-of-experts-простыми-словами"&gt;Что такое Mixture of Experts простыми словами&lt;/h2&gt;
&lt;p&gt;Представьте больницу, где работают узкие специалисты: терапевт, кардиолог, невролог. Когда к ним приходит пациент, его направляют к одному-двум нужным врачам, а не ко всем сразу. Это быстро, точно и экономично.&lt;/p&gt;</description></item><item><title>RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Sat, 14 Feb 2026 12:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — это архитектурный паттерн, при котором языковая модель перед генерацией ответа сначала ищет релевантную информацию во внешних источниках и использует её как контекст. Проще говоря, модель не полагается только на свою «память» — она сначала «заглядывает в справочник», а потом отвечает.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-это-нужно"&gt;Зачем это нужно&lt;/h2&gt;
&lt;p&gt;Большие языковые модели (LLM) обучены на огромных объёмах текста, но их знания заморожены на момент обучения. Они не знают о вчерашних событиях, не имеют доступа к вашим внутренним документам и иногда уверенно выдумывают факты — это называется &lt;strong&gt;галлюцинациями&lt;/strong&gt;.&lt;/p&gt;</description></item><item><title>ИИ-агенты (AI Agents)</title><link>/glossary/ii-agenty-ai-agents/</link><pubDate>Thu, 12 Feb 2026 12:00:00 +0300</pubDate><guid>/glossary/ii-agenty-ai-agents/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;ИИ-агент (AI Agent)&lt;/strong&gt; — это программная система на базе искусственного интеллекта, которая способна самостоятельно планировать последовательность действий, использовать внешние инструменты и адаптировать своё поведение для достижения поставленной цели — без пошагового управления со стороны человека.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="чем-агент-отличается-от-обычного-чат-бота"&gt;Чем агент отличается от обычного чат-бота&lt;/h2&gt;
&lt;p&gt;Обычный чат-бот работает в формате «вопрос → ответ»: вы пишете промпт, модель генерирует текст. ИИ-агент устроен иначе. Он получает &lt;strong&gt;цель&lt;/strong&gt;, а не инструкцию, и сам определяет, какие шаги нужно предпринять. Если один шаг не сработал, агент пересматривает план и пробует другой подход.&lt;/p&gt;</description></item><item><title>Mixture of Experts — MoE (Смесь экспертов)</title><link>/glossary/mixture-of-experts-moe/</link><pubDate>Tue, 10 Feb 2026 09:00:00 +0300</pubDate><guid>/glossary/mixture-of-experts-moe/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;Mixture of Experts (MoE)&lt;/strong&gt; — архитектура нейросети, в которой большая модель разбита на множество специализированных подсетей («экспертов»). При обработке каждого запроса активируется лишь небольшая часть этих экспертов — та, что наиболее подходит для задачи. Остальные в работе не участвуют.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="что-такое-moe-простыми-словами"&gt;Что такое MoE простыми словами&lt;/h2&gt;
&lt;p&gt;Представьте компанию, в которой работают сотни узких специалистов: юристы, программисты, дизайнеры, финансисты. Когда клиент приходит с задачей, менеджер (он же «роутер») оценивает вопрос и направляет его к двум-трём нужным специалистам. Остальные сотрудники в этот момент отдыхают.&lt;/p&gt;</description></item><item><title>RAG — генерация с дополненным извлечением (Retrieval-Augmented Generation)</title><link>/glossary/rag-retrieval-augmented-generation/</link><pubDate>Mon, 09 Feb 2026 09:00:00 +0300</pubDate><guid>/glossary/rag-retrieval-augmented-generation/</guid><description>&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Info&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;strong&gt;RAG (Retrieval-Augmented Generation)&lt;/strong&gt; — подход, при котором языковая модель перед генерацией ответа сначала ищет релевантную информацию во внешней базе знаний. Это позволяет давать точные, актуальные ответы без необходимости переобучать модель.&lt;/div&gt;
&lt;/div&gt;

&lt;h2 id="зачем-нужен-rag"&gt;Зачем нужен RAG&lt;/h2&gt;
&lt;p&gt;Большие языковые модели (LLM) обучены на огромных массивах текста, но у них есть два фундаментальных ограничения: знания «заморожены» на момент обучения, и модель может уверенно выдавать ложную информацию — так называемые галлюцинации.&lt;/p&gt;
&lt;p&gt;RAG решает обе проблемы. Вместо того чтобы полагаться только на «память» модели, система сначала находит нужные документы и подставляет их в контекст запроса. Модель отвечает, опираясь на конкретные источники, а не на догадки.&lt;/p&gt;</description></item></channel></rss>