oMLX: LLM-сервер для Apple Silicon из меню macOS

Thu, 14 May 2026 11:00:00 +0300

oMLX: LLM-инференс сервер для Apple Silicon с SSD-кешем и управлением из меню macOS

oMLX — это LLM-инференс сервер, оптимизированный для Mac: с continuous batching и многоуровневым KV-кешированием, управляемый прямо из меню macOS. Проект выложен на GitHub под лицензией Apache 2.0 и полностью бесплатен.

«Every LLM server I tried made me choose between convenience and control» — автор проекта о причинах его создания.

Что это и для кого

oMLX — это локальный LLM-инференс сервер, специально разработанный для Apple Silicon (M1/M2/M3/M4), достигающий высокой производительности через continuous batching и многоуровневое KV-кеширование.

Inference Server on AI-Uchi — Всё об искусственном интеллекте

oMLX: LLM-сервер для Apple Silicon из меню macOS

oMLX: LLM-инференс сервер для Apple Silicon с SSD-кешем и управлением из меню macOS

Что это и для кого