<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Безопасность LLM on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/%D0%B1%D0%B5%D0%B7%D0%BE%D0%BF%D0%B0%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C-llm/</link><description>Recent content in Безопасность LLM on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Wed, 24 Jun 2026 11:00:00 +0300</lastBuildDate><atom:link href="/tags/%D0%B1%D0%B5%D0%B7%D0%BE%D0%BF%D0%B0%D1%81%D0%BD%D0%BE%D1%81%D1%82%D1%8C-llm/index.xml" rel="self" type="application/rss+xml"/><item><title>Prompt Injection как путаница ролей в LLM</title><link>/articles/prompt-injection-kak-putanica-rolej-llm/</link><pubDate>Wed, 24 Jun 2026 11:00:00 +0300</pubDate><guid>/articles/prompt-injection-kak-putanica-rolej-llm/</guid><description>&lt;h1 id="prompt-injection-как-путаница-ролей-почему-llm-верит-стилю-а-не-источнику"&gt;Prompt Injection как путаница ролей: почему LLM верит стилю, а не источнику&lt;/h1&gt;
&lt;p&gt;Представьте охранника на входе в секретное здание. Вместо того чтобы проверять удостоверение, он пропускает людей, которые &lt;em&gt;звучат авторитетно&lt;/em&gt; — говорят официальным тоном, используют правильную терминологию. Именно так работают современные языковые модели, когда речь заходит о разграничении ролей. И именно это делает их уязвимыми к одной из самых коварных атак в мире AI-безопасности.&lt;/p&gt;
&lt;p&gt;Исследование «Prompt Injection as Role Confusion» было принято на конференцию ICML 2026 и предлагает первое полноценное механистическое объяснение того, почему prompt injection атаки работают даже против самых защищённых моделей.&lt;/p&gt;</description></item></channel></rss>