<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>VLM on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/vlm/</link><description>Recent content in VLM on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Thu, 19 Feb 2026 15:00:00 +0300</lastBuildDate><atom:link href="/tags/vlm/index.xml" rel="self" type="application/rss+xml"/><item><title>Мультимодальные модели: как AI научился видеть и слышать</title><link>/articles/multimodalnye-modeli-kak-ai-nauchilsia-videt-i-slyshat/</link><pubDate>Thu, 19 Feb 2026 15:00:00 +0300</pubDate><guid>/articles/multimodalnye-modeli-kak-ai-nauchilsia-videt-i-slyshat/</guid><description>&lt;p&gt;Ещё пару лет назад языковые модели работали исключительно с текстом. Вы могли спросить ChatGPT о чём угодно — но показать ему фотографию или проиграть аудиозапись было невозможно. Сегодня ведущие модели одновременно анализируют текст, изображения, аудио и видео, а некоторые — генерируют контент сразу в нескольких модальностях. Это не эволюция — это смена парадигмы.&lt;/p&gt;
&lt;p&gt;В этой статье разберём, как устроены мультимодальные модели изнутри, сравним ключевых игроков рынка и покажем, где эти технологии уже приносят реальную пользу.&lt;/p&gt;</description></item></channel></rss>