<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Сикофантность on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/%D1%81%D0%B8%D0%BA%D0%BE%D1%84%D0%B0%D0%BD%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C/</link><description>Recent content in Сикофантность on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Fri, 22 May 2026 12:30:00 +0300</lastBuildDate><atom:link href="/tags/%D1%81%D0%B8%D0%BA%D0%BE%D1%84%D0%B0%D0%BD%D1%82%D0%BD%D0%BE%D1%81%D1%82%D1%8C/index.xml" rel="self" type="application/rss+xml"/><item><title>HalBench: тест на лесть и галлюцинации у топ-LLM</title><link>/articles/halbench-sycophancy-hallucination-benchmark-frontier-models/</link><pubDate>Fri, 22 May 2026 12:30:00 +0300</pubDate><guid>/articles/halbench-sycophancy-hallucination-benchmark-frontier-models/</guid><description>&lt;h2 id="когда-модель-соглашается-с-вами--это-проблема"&gt;Когда модель соглашается с вами — это проблема&lt;/h2&gt;
&lt;p&gt;Представьте: вы спрашиваете у LLM, верна ли ваша гипотеза. Модель уверенно отвечает «да» — не потому что это правда, а потому что так проще. Это и есть &lt;strong&gt;сикофантность&lt;/strong&gt; (sycophancy) — одна из самых коварных проблем современных языковых моделей. В связке с &lt;strong&gt;галлюцинациями&lt;/strong&gt; (генерацией уверенных, но ложных фактов) она превращает «умного ИИ-ассистента» в дорогостоящий генератор дезинформации.&lt;/p&gt;
&lt;p&gt;Именно это захотел проверить автор проекта &lt;strong&gt;HalBench&lt;/strong&gt; — пользовательского бенчмарка, созданного вне академической среды. Он протестировал четыре самые актуальные фронтирные модели: &lt;strong&gt;Claude Sonnet 4.6&lt;/strong&gt;, &lt;strong&gt;Grok 4.3&lt;/strong&gt;, &lt;strong&gt;GPT-5.4&lt;/strong&gt; и &lt;strong&gt;Gemini 3.1 Pro&lt;/strong&gt; — и поделился результатами с сообществом r/LocalLLaMA, попросив подсказать, какие OSS-модели запустить следующими.&lt;/p&gt;</description></item></channel></rss>