<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Оптимизация on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F/</link><description>Recent content in Оптимизация on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Tue, 14 Apr 2026 13:00:00 +0300</lastBuildDate><atom:link href="/tags/%D0%BE%D0%BF%D1%82%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F/index.xml" rel="self" type="application/rss+xml"/><item><title>ChatGPT Image Merge: экономия лимитов через объединение изображений</title><link>/articles/chatgpt-image-merge-ekonomiya-limitov/</link><pubDate>Tue, 14 Apr 2026 13:00:00 +0300</pubDate><guid>/articles/chatgpt-image-merge-ekonomiya-limitov/</guid><description>&lt;p&gt;ChatGPT накладывает жесткие лимиты на загрузку изображений — всего 50 файлов за 3 часа для Plus-подписчиков и еще меньше для бесплатных пользователей. При работе с множественными скриншотами, схемами или документами эти ограничения быстро исчерпываются. Разработчик создал бесплатный инструмент, который объединяет изображения из буфера обмена в единую сетку, радикально экономя лимиты загрузки.&lt;/p&gt;
&lt;h2 id="проблема-лимитов-chatgpt-на-изображения"&gt;Проблема лимитов ChatGPT на изображения&lt;/h2&gt;
&lt;p&gt;OpenAI установила строгие ограничения на загрузку изображений в ChatGPT:&lt;/p&gt;



&lt;div class="callout callout-info"&gt;
 &lt;div class="callout-title"&gt;&amp;#8505; Текущие лимиты&lt;/div&gt;
 &lt;div class="callout-content"&gt;&lt;ul&gt;
&lt;li&gt;ChatGPT Plus: 50 изображений за 3 часа&lt;/li&gt;
&lt;li&gt;ChatGPT Free: 2 изображения за 1 час (ориентировочно)&lt;/li&gt;
&lt;li&gt;GPT-4 Vision API: зависит от плана подписки&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;
&lt;/div&gt;

&lt;p&gt;Для аналитиков, дизайнеров и исследователей, работающих с большими объемами визуального контента, эти ограничения критичны. Загрузка серии скриншотов интерфейса, документов или диаграмм быстро исчерпывает дневной лимит.&lt;/p&gt;</description></item><item><title>Anthropic тайно сократила время кэширования Claude с часа до 5 минут</title><link>/news/anthropic-sokraschaet-vremya-keshirovaniya-claude/</link><pubDate>Sun, 12 Apr 2026 16:54:14 +0300</pubDate><guid>/news/anthropic-sokraschaet-vremya-keshirovaniya-claude/</guid><description>&lt;p&gt;Пользователи Claude Code столкнулись с неожиданным ростом расходов после того, как Anthropic тайно сократила время жизни кэша (TTL) с 1 часа до 5 минут в начале марта 2024 года. Анализ данных показал увеличение затрат на кэширование на 17-25% и рост потребления квоты для подписчиков.&lt;/p&gt;
&lt;h2 id="скрытые-изменения-в-кэшировании"&gt;Скрытые изменения в кэшировании&lt;/h2&gt;



&lt;div class="callout callout-warning"&gt;
 &lt;div class="callout-title"&gt;&amp;#9888; Внимание&lt;/div&gt;
 &lt;div class="callout-content"&gt;Изменения были внесены без уведомления пользователей, что привело к неожиданному росту расходов на API-вызовы.&lt;/div&gt;
&lt;/div&gt;

&lt;p&gt;Детальный анализ 119,866 API-вызовов с двух независимых машин за период с января по апрель 2024 года выявил четкую картину изменений:&lt;/p&gt;</description></item><item><title>Как работает инференс: от запроса до ответа</title><link>/articles/kak-rabotaet-inferens-ot-zaprosa-do-otveta/</link><pubDate>Sun, 22 Feb 2026 15:00:00 +0300</pubDate><guid>/articles/kak-rabotaet-inferens-ot-zaprosa-do-otveta/</guid><description>&lt;p&gt;Вы вводите запрос в ChatGPT, Claude или Gemini — и через долю секунды на экране начинают появляться слова. За этой кажущейся простотой скрывается сложнейший конвейер: токенизация, матричные вычисления на миллиардах параметров, управление памятью GPU и десятки оптимизаций, отточенных годами исследований. Этот конвейер называется &lt;strong&gt;инференс&lt;/strong&gt; (inference) — процесс получения ответа от обученной модели.&lt;/p&gt;
&lt;p&gt;В этой статье разберём каждый этап пути от текстового запроса до сгенерированного ответа и объясним, какие инженерные решения позволяют получать ответы за сотни миллисекунд.&lt;/p&gt;</description></item></channel></rss>