Mixture of Experts (MoE)

Thu, 19 Feb 2026 15:00:00 +0300

ℹ Info

Mixture of Experts (MoE) — архитектура языковой модели, в которой вместо одного монолитного блока используется набор специализированных подсетей («экспертов»). При обработке каждого токена активируется лишь небольшая часть экспертов, что снижает вычислительную нагрузку без потери качества.

Простыми словами

Представьте большую редакцию с сотней специалистов: юристы, экономисты, переводчики, программисты. Когда поступает задача, её не решают все сразу — её направляют к двум-трём подходящим экспертам. Остальные в это время свободны.

MoE работает точно так же. Модель содержит десятки или сотни «экспертных» слоёв, но на каждый токен активируются только несколько из них. Специальный компонент — роутер (gating network) — решает, кому передать слово.

Inference on AI-Uchi — Всё об искусственном интеллекте

Mixture of Experts (MoE)

Простыми словами