HalBench: тест на лесть и галлюцинации у топ-LLM
Разбираем пользовательский бенчмарк HalBench: как Claude Sonnet 4.6, Grok 4.3, GPT-5.4 и Gemini 3.1 …
Разбираем пользовательский бенчмарк HalBench: как Claude Sonnet 4.6, Grok 4.3, GPT-5.4 и Gemini 3.1 …
OpenAI обновила ChatGPT: теперь он распознаёт риск в чувствительных разговорах, отслеживая контекст …
OpenAI выпустила три голосовых модели в Realtime API: GPT-Realtime-2, GPT-Realtime-Translate и …
OpenAI и AWS расширили партнёрство: GPT-5.5, Codex и Managed Agents теперь доступны на Amazon …
OpenAI опубликовала пятиступенчатый план по демократизации киберзащиты с помощью ИИ и защите …
DeepSeek V4 Pro сравнялся с GPT-5.2 на агентном бенчмарке FoodTruck Bench — за 10 недель и примерно …
OpenAI объяснила, почему GPT-5.5 одержим гоблинами и гремлинами: история о том, как одна награда в …
Готовый промпт для создания коммерческого предложения с помощью AI: структура, примеры, вариации под …
Готовый промпт, который помогает составить идеальный system prompt для персонального AI-ассистента — …