22 MayarticleHalBench: тест на лесть и галлюцинации у топ-LLMРазбираем пользовательский бенчмарк HalBench: как Claude Sonnet 4.6, Grok 4.3, GPT-5.4 и Gemini 3.1 …→