Новые модели Microsoft MAI: рассуждения и код

Microsoft выходит на рынок собственных LLM-моделей

На конференции Build 2026 в Сан-Франциско Microsoft представила сразу несколько собственных языковых моделей (LLM — Large Language Model, большая языковая модель). На Build 2026 Microsoft объявила о значительном расширении портфеля моделей, созданных командой Microsoft AI Superintelligence: в новую линейку вошли первая reasoning-модель компании и кодинговая модель, разработанная специально для GitHub Copilot.

Главная интрига: в отличие от привычной стратегии перепродажи чужих моделей через Azure, теперь Microsoft играет на поле OpenAI, Anthropic и Google с собственными разработками. Компания стремится занять больше уровней в AI-стеке по мере того, как OpenAI и Anthropic фиксируют рекордный рост и движутся к выходу на публичный рынок.

ℹ Контекст

До этого момента Microsoft вкладывала деньги в чужие модели: 13 миллиардов долларов — в OpenAI и 5 миллиардов — в Anthropic, предоставляя их через Azure. Теперь компания делает ставку на собственные разработки.

MAI-Thinking-1: первая reasoning-модель Microsoft

Что это такое

MAI-Thinking-1 — первая reasoning-модель (модель рассуждений) в линейке Microsoft AI. Компания подчёркивает, что модель обучена с нуля без дистилляции (то есть без «переноса знаний» от сторонних моделей), на чистых, коммерчески лицензированных данных корпоративного класса. Это модель среднего размера: 35 миллиардов активных параметров и контекстное окно в 128 000 токенов.

Reasoning-модели (модели рассуждений) — класс LLM, которые перед выдачей ответа выполняют многошаговый внутренний «процесс размышления», что позволяет им решать сложные логические и математические задачи значительно лучше обычных моделей.

Microsoft настроила MAI-Thinking-1 для работы со сложными многошаговыми инструкциями, долгоконтекстными рассуждениями и генерацией кода.

Впечатляющие заявления о производительности

Microsoft сообщает, что независимые оценщики предпочли MAI-Thinking-1 модели Claude Sonnet 4.6 от Anthropic в слепом попарном тестировании. Кроме того, по заявлению компании, модель сравнялась с Claude Opus 4.6 по задачам программирования в бенчмарке SWE-bench Pro.

Общий контекст этих цифр подчёркивает технический обозреватель Саймон Уиллисон: утверждение о том, что MAI-Thinking-1 «предпочтительнее Sonnet 4.6» — впечатляет для модели в 35B параметров, учитывая, что модели большего размера уже можно запускать на обычном ноутбуке.

⚠ Важная оговорка

Microsoft не предоставила развёрнутых сравнительных тестов — приведённые данные основаны на собственных оценках компании. Независимая проверка результатов ещё предстоит.

Доступность

MAI-Thinking-1 сейчас доступна в режиме приватного превью через платформу Microsoft Foundry. Широкая публика пока не имеет к ней доступа — модель открыта лишь для избранных партнёров.

MAI-Code-1-Flash: кодинговая модель для GitHub Copilot

Суть разработки

MAI-Code-1-Flash — новая кодинговая модель Microsoft, созданная для быстрой и эффективной помощи в повседневных рабочих процессах разработчика. Модель построена Microsoft от начала до конца с использованием чистых и надлежащим образом лицензированных данных.

Ключевое отличие от конкурентов — подход к обучению. Microsoft строила MAI-Code-1-Flash вокруг реальных производственных рабочих процессов, а не только оптимизируя по бенчмаркам: модель обучалась непосредственно на реальных харнессах (production harnesses — наборах инструментов и сценариев использования) GitHub Copilot, что позволило ей научиться взаимодействовать с окружающими инструментами в агентных задачах кодирования.

💡 Что такое production harness?

Harness (буквально «упряжь») в контексте разработки ПО — это набор реальных инструментов, сценариев и контекстов, в которых модель работает в продакшене. Обучение на таких харнессах означает, что MAI-Code-1-Flash натренирована не на абстрактных задачах, а на реальном поведении разработчиков в VS Code.

Адаптивное мышление и экономия токенов

Модель использует адаптивное мышление: остаётся краткой для простых запросов и тратит больший бюджет рассуждений на сложные задачи. Это напрямую влияет на стоимость использования.

MAI-Code-1-Flash не просто умнее — она экономнее: решает более сложные задачи, используя до 60% меньше токенов на SWE-Bench Verified, доказывая, что высокая точность и эффективность больше не являются компромиссом.

В условиях перехода GitHub Copilot на модель оплаты по фактическому использованию AI Credits с 1 июня, эффективность по токенам — уже не абстрактное инженерное достижение, а прямая экономия денег.

Результаты бенчмарков

MAI-Code-1-Flash превосходит Claude Haiku 4.5 по всем ключевым протестированным бенчмаркам кодинга, включая преимущество в 16 процентных пунктов на разнообразных реальных задачах SWE-Bench Pro (51,2% против 35,2%).

В adversarial-бенчмарке (тест на устойчивость к хитрым ловушкам) MAI-Code-1-Flash набрала 85,8% скорректированной точности, показав особенно сильные результаты в рассуждениях, следовании инструкциям и распознавании невозможных задач.

Доступность для разработчиков

Модель разворачивается для индивидуальных пользователей GitHub Copilot в Visual Studio Code — в меню выбора модели и под автоматическим выбором по умолчанию. Дополнительная настройка не требуется.

Модель доступна на всех платных тарифах Copilot: Free, Pro ($10/мес.), Pro+ ($39/мес.) и Max.

Сравнение двух новых моделей MAI

Параметр	MAI-Thinking-1	MAI-Code-1-Flash
Тип	Reasoning (рассуждения)	Кодинговая
Параметры	35B	5B
Контекстное окно	128K токенов	Не раскрыто
Обучение	С нуля, без дистилляции	На production-харнессах Copilot
Доступность	Приватный превью (Microsoft Foundry)	Все тарифы GitHub Copilot (VS Code)
Главный конкурент	Claude Sonnet 4.6 / Opus 4.6	Claude Haiku 4.5
Экономия токенов	Акцент на низкую стоимость	До 60% меньше токенов

Архитектура линейки MAI: полная картина


graph TD
    MAI[Линейка моделей Microsoft MAI]
    MAI --> TEXT[Текстовые модели]
    MAI --> IMAGE[Визуальные модели]
    MAI --> AUDIO[Аудиомодели]
    TEXT --> T1[MAI-Thinking-1\n35B params, reasoning]
    TEXT --> C1[MAI-Code-1-Flash\n5B params, кодинг]
    IMAGE --> I1[MAI-Image-2.5\ntext-to-image + img2img]
    IMAGE --> I2[MAI-Image-2.5 Flash\nбыстрая версия]
    AUDIO --> V1[MAI-Voice-2\n15+ новых языков]
    AUDIO --> TR1[MAI-Transcribe-1.5\n43 языка, STT]

Вместе с MAI-Thinking-1 Microsoft представила целый ряд других AI-моделей, охватывающих генерацию изображений, транскрипцию речи и синтез голоса.

MAI-Image-2.5 обеспечивает улучшенный рендеринг текста, стилизованные иллюстрации и качество коммерческих изображений по сравнению с MAI-Image-2.
MAI-Transcribe-1.5 позиционируется как модель, работающая «в пять раз быстрее конкурирующих моделей».
MAI-Voice-2 и его flash-вариант предлагают поддержку более чем 15 дополнительных языков и новые голосовые опции.

Стратегический смысл: зачем Microsoft собственные модели?

Снижение зависимости от партнёров

Это объявление значимо потому, что Microsoft традиционно полагалась на модели OpenAI и Anthropic для поддержки функций кодирования в GitHub Copilot. Теперь компания начинает закрывать этот пробел собственными разработками.

По информации CNBC, анонсы MAI — часть усилий Microsoft по запуску большего числа проприетарных моделей на Azure и сокращению платежей сторонним провайдерам моделей, таким как OpenAI.

Малые параметры — большая эффективность

Обратите внимание на цифры: MAI-Thinking-1 имеет 35B параметров, а MAI-Code-1-Flash — всего 5B. Это компактные модели по современным меркам. Очень интересно наблюдать, как Microsoft выпускает модели с такими низкими показателями числа параметров — особенно с учётом того, насколько дорог сейчас доступ к крупным моделям.

MAI-Thinking-1 описывается как модель среднего размера, «созданная для высокой эффективности и производительности, но, что важно, с низкой стоимостью по токенам».

Открытость экосистемы

Помимо Microsoft Foundry и собственных продуктов, компания объявила, что модели MAI также станут доступны через Fireworks AI, Baseten и OpenRouter. Это позволит независимым разработчикам использовать MAI-модели за пределами экосистемы Microsoft.

📝 Для разработчиков

Если вы пользуетесь GitHub Copilot в VS Code, MAI-Code-1-Flash уже может появиться в вашем меню выбора модели — без каких-либо дополнительных настроек. По мере расширения роллаута GitHub Copilot может автоматически направлять задачи в MAI-Code-1-Flash через Auto picker.

Выводы

Microsoft делает стратегически важный шаг: из инфраструктурного провайдера и инвестора она превращается в полноценного игрока на рынке AI-моделей. Компактность новых моделей — не слабость, а осознанный выбор в пользу экономической эффективности.

MAI-Code-1-Flash — лишь первая в новой волне кодинговых моделей, специально созданных Microsoft. Это означает, что конкуренция в сегменте AI-инструментов для разработчиков будет только нарастать — к выгоде всех, кто пишет код.