<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Мультимодальные Модели on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/%D0%BC%D1%83%D0%BB%D1%8C%D1%82%D0%B8%D0%BC%D0%BE%D0%B4%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5-%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8/</link><description>Recent content in Мультимодальные Модели on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Mon, 13 Apr 2026 13:00:00 +0300</lastBuildDate><atom:link href="/tags/%D0%BC%D1%83%D0%BB%D1%8C%D1%82%D0%B8%D0%BC%D0%BE%D0%B4%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5-%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B8/index.xml" rel="self" type="application/rss+xml"/><item><title>Как AI понимает визуальный поиск: технология Google</title><link>/translations/kak-ai-ponimaet-vizualnyi-poisk-google/</link><pubDate>Mon, 13 Apr 2026 13:00:00 +0300</pubDate><guid>/translations/kak-ai-ponimaet-vizualnyi-poisk-google/</guid><description>&lt;p&gt;Вы наверняка с этим сталкивались: видите в ленте фотографию идеально обставленной комнаты или стильный уличный образ — и хотите узнать, где купить &lt;strong&gt;каждый&lt;/strong&gt; элемент. До недавнего времени визуальный поиск работал по принципу «один запрос — один предмет». Но в начале 2026 года Google кардинально изменила подход: обновлённые Circle to Search и Google Lens научились распознавать и искать &lt;strong&gt;несколько объектов на одном изображении одновременно&lt;/strong&gt;.&lt;/p&gt;
&lt;p&gt;Чтобы разобраться, как именно это работает, поговорим о технологиях, стоящих за этим прорывом. В основе — интервью с Дунией Беррада (Dounia Berrada), старшим директором по разработке Google Search, которая отвечает за мультимодальный поиск и Google Lens.&lt;/p&gt;</description></item><item><title>Мультимодальные модели: как AI научился видеть и слышать</title><link>/articles/multimodalnye-modeli-kak-ai-nauchilsia-videt-i-slyshat/</link><pubDate>Thu, 19 Feb 2026 15:00:00 +0300</pubDate><guid>/articles/multimodalnye-modeli-kak-ai-nauchilsia-videt-i-slyshat/</guid><description>&lt;p&gt;Ещё пару лет назад языковые модели работали исключительно с текстом. Вы могли спросить ChatGPT о чём угодно — но показать ему фотографию или проиграть аудиозапись было невозможно. Сегодня ведущие модели одновременно анализируют текст, изображения, аудио и видео, а некоторые — генерируют контент сразу в нескольких модальностях. Это не эволюция — это смена парадигмы.&lt;/p&gt;
&lt;p&gt;В этой статье разберём, как устроены мультимодальные модели изнутри, сравним ключевых игроков рынка и покажем, где эти технологии уже приносят реальную пользу.&lt;/p&gt;</description></item></channel></rss>