<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Small LLM on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/small-llm/</link><description>Recent content in Small LLM on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Wed, 20 May 2026 08:00:00 +0300</lastBuildDate><atom:link href="/tags/small-llm/index.xml" rel="self" type="application/rss+xml"/><item><title>87% на бенчмарке с моделью 4B: как это работает</title><link>/articles/coding-agent-87-percent-4b-model/</link><pubDate>Wed, 20 May 2026 08:00:00 +0300</pubDate><guid>/articles/coding-agent-87-percent-4b-model/</guid><description>&lt;h1 id="87-на-бенчмарке-с-моделью-4b-как-это-работает"&gt;87% на бенчмарке с моделью 4B: как это работает&lt;/h1&gt;
&lt;p&gt;Все привыкли к тому, что высокие результаты на бенчмарках по программированию — удел больших закрытых моделей: GPT-4, Claude Opus, Gemini Ultra. Но что если 4-миллиардная модель, запускаемая на ноутбуке, способна показать 87% на HumanEval? Звучит как кликбейт — но это реальная инженерная задача, которую удалось решить за счёт грамотной архитектуры агента, а не за счёт размера модели.&lt;/p&gt;
&lt;p&gt;В этом материале — полный разбор того, как устроен такой агент: какие техники применяются, как правильно выбрать бенчмарк, и почему «маленькая» модель с умным скаффолдингом может обыграть «большую» модель в лоб.&lt;/p&gt;</description></item></channel></rss>