<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Alec-Radford on AI-Uchi — Всё об искусственном интеллекте</title><link>/tags/alec-radford/</link><description>Recent content in Alec-Radford on AI-Uchi — Всё об искусственном интеллекте</description><generator>Hugo</generator><language>ru</language><lastBuildDate>Wed, 29 Apr 2026 03:06:46 +0300</lastBuildDate><atom:link href="/tags/alec-radford/index.xml" rel="self" type="application/rss+xml"/><item><title>Talkie: LLM из 1930-х, обученный с помощью Claude</title><link>/news/talkie-llm-1930-obuchyon-s-pomoshchyu-claude/</link><pubDate>Wed, 29 Apr 2026 03:06:46 +0300</pubDate><guid>/news/talkie-llm-1930-obuchyon-s-pomoshchyu-claude/</guid><description>&lt;h2 id="модель-из-прошлого-созданная-с-помощью-настоящего"&gt;Модель из прошлого, созданная с помощью настоящего&lt;/h2&gt;
&lt;p&gt;28 апреля 2026 года исследователи Алек Рэдфорд (Alec Radford), Ник Левин (Nick Levine) и Дэвид Дюванод (David Duvenaud) выпустили &lt;strong&gt;Talkie&lt;/strong&gt; — языковую модель на 13 миллиардов параметров, обученную исключительно на текстах, опубликованных до 1931 года. Примечательно, что в создании этой «исторической» модели активно участвовали современные инструменты Anthropic: в процессе пост-тренировки исследователи использовали Claude Sonnet 4.6 в роли судьи (judge) при online DPO (direct preference optimization — прямой оптимизации предпочтений), а финальный раунд обучения с учителем использовал синтетические многоходовые диалоги, сгенерированные между Claude Opus 4.6 и самой Talkie.&lt;/p&gt;</description></item></channel></rss>