<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>AirLLM on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/airllm/</link><description>Recent content in AirLLM on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Thu, 04 Jun 2026 03:14:16 +0300</lastBuildDate><atom:link href="/tags/airllm/index.xml" rel="self" type="application/rss+xml"/><item><title>AirLLM: запуск 70B модели на GPU с 4 ГБ VRAM</title><link>/news/airllm-70b-model-na-4gb-gpu/</link><pubDate>Thu, 04 Jun 2026 03:14:16 +0300</pubDate><guid>/news/airllm-70b-model-na-4gb-gpu/</guid><description>&lt;h2 id="70b-модель-на-бюджетной-видеокарте--это-реально"&gt;70B модель на бюджетной видеокарте — это реально&lt;/h2&gt;
&lt;p&gt;AirLLM — open-source инструмент, который даёт возможность запускать языковые модели с 70 миллиардами параметров на одной GPU с всего лишь 4 ГБ видеопамяти. И всё это без квантизации (quantization), дистилляции (distillation) или прунинга (pruning) — техник, которые обычно применяются для «облегчения» моделей ценой потери точности. А в последних версиях планка поднялась ещё выше: Llama 3.1 на 405 миллиардов параметров теперь работает на GPU с 8 ГБ VRAM.&lt;/p&gt;</description></item></channel></rss>