11 FebarticleТокенизация простыми словами: как LLM понимает текстРазбираемся, как языковые модели разбивают текст на токены, зачем нужен BPE и почему русский язык …→