
FluidVoice: офлайн-диктовка на macOS с AI без подписки
Обзор FluidVoice — бесплатного open-source приложения для голосового ввода на macOS. Работает полностью офлайн, поддерживает Whisper, Parakeet, Nemotron и 40+ языков.
FluidVoice: самый быстрый офлайн-диктовщик для macOS — и бесплатно
«Большинство полированных приложений диктовки отправляют текст в облако. FluidVoice работает иначе — всё локально, ноль данных покидает ваш Mac.»
FluidVoice — это open-source приложение для голосового ввода на macOS с AI-улучшением прямо на устройстве. Оно построено на движке FluidAudio и широко позиционируется как бесплатная приватная альтернатива Wispr Flow; на момент написания репозиторий набрал около 2 600 звёзд на GitHub и более 25 000 загрузок.
Что это и для кого
FluidVoice — нативное macOS-приложение: нажмите хоткей, говорите, и текст появляется прямо в Notes, Slack, Cursor, Gmail или любом текстовом поле. Локальный AI держит голос на устройстве. Приложение создано для высокоскоростной транскрипции с приоритетом приватности — диктуйте напрямую в любое активное текстовое поле, не отправляя аудиоданные в облако.
Кому подойдёт:
- Разработчикам и техническим специалистам, работающим с конфиденциальными данными
- Авторам и журналистам, которые ценят скорость и приватность
- Пользователям Apple Silicon, желающим выжать максимум из процессора
- Всем, кто устал платить подписку за диктовку
Установка
Установить через Homebrew можно одной командой:
brew install --cask fluidvoice
После установки FluidVoice проведёт вас через онбординг:
graph TD
A[Установить FluidVoice] --> B[Выдать права: микрофон + Accessibility]
B --> C[Выбрать глобальный хоткей]
C --> D[Выбрать речевую модель]
D --> E{Хотите AI-улучшение?}
E -->|Да, локально| F[Скачать Fluid Intelligence ~3.5 ГБ]
E -->|Да, облако| G[Добавить API-ключ OpenAI / Groq]
E -->|Нет| H[Готово к работе]
F --> H
G --> H
Достаточно задать глобальный хоткей в настройках и пройти онбординг — выбрать голосовую модель под ваш язык и требования к скорости. Модели варьируются от Apple Speech (без загрузки) до высокоточных Nemotron и Whisper.
Ключевые возможности
1. Множество речевых моделей
Линейка моделей охватывает Nemotron Speech 3.5, Parakeet Flash, Parakeet TDT v3/v2, Cohere Transcribe, Apple Speech и Whisper — с оптимизированной маршрутизацией для коротких и длинных сессий.
| Модель | Языки | Особенность |
|---|---|---|
| Nemotron Speech 3.5 Ultra | ~40 | Минимальная задержка |
| Parakeet Flash (Beta) | Только EN | Быстрейший, стриминг |
| Parakeet TDT v3 | 25 | Оптимизирован под Apple Silicon |
| Cohere Transcribe | 14 | Точность пунктуации и чисел |
| Apple Speech | Системные | Без загрузки |
| Whisper (Tiny→Large) | до 99 | Максимальный охват языков |
2. Fluid Intelligence — локальный AI-слой
Fluid Intelligence — отдельный, приватно поддерживаемый локальный AI-рантайм, который обеспечивает продвинутое улучшение диктовки прямо на устройстве: умное форматирование, контекстно-зависимую капитализацию и постобработку.
Модель обучена на более чем 100 000 точках данных диктовки; для работы требует ~3,5 ГБ дискового пространства и ~3,5 ГБ ОЗУ.
3. Три режима работы
Write Mode, Command Mode и Direct Dictation — переключайтесь между контекстами мгновенно.
- Direct Dictation — текст вставляется прямо в активное поле
- Write Mode — переписать выделенный текст или создать новый контент в любом текстовом поле с помощью голосовых инструкций
- Command Mode — выполнять команды в терминале, управлять нативными macOS-приложениями и автоматизировать задачи голосом
4. Скорость
Архитектура на основе CoreML и Metal достигает воспринимаемой задержки менее 100 мс и коэффициента реального времени 3 380×, позволяя обрабатывать почти час речи за одну секунду.
Речь примерно в 3,7 раза быстрее набора текста — это около 9 минут экономии на каждые 500 слов.
5. Адаптивный тон под приложение
FluidVoice определяет, какое приложение активно, и автоматически выбирает подходящий тональный профиль. Fluid-1 переписывает ваши слова в соответствии с контекстом, не меняя смысла.
6. История аудио и статистика
Опциональная локальная история аудио с бюджетными ограничениями и экспортом в ZIP — найти в Preferences → Audio History. Также доступна статистика использования за день с карточкой в шапке и пиллом в панели инструментов.
7. Опциональная облачная интеграция
При желании можно подключить собственный API-ключ OpenAI, Groq или другого провайдера для облачного улучшения. Ключи хранятся в macOS Keychain.
Тарифы и цены
Проект полностью бесплатен и опубликован под лицензией GPLv3.
| Что | Стоимость |
|---|---|
| Базовое приложение | Бесплатно (GPLv3) |
| Fluid Intelligence (локальный AI) | Бесплатно, ~3,5 ГБ загрузка |
| Облачный AI (OpenAI, Groq) | По тарифам провайдера (ключ ваш) |
Если FluidVoice делает ваш день чуть лучше, вы можете поддержать его разработку через GitHub Sponsors.
Плюсы и минусы
| ✅ Плюсы | ❌ Минусы |
|---|---|
| Полностью бесплатен и open-source (GPLv3) | Только macOS 15.0+ |
| Весь AI на устройстве, данные не покидают Mac | Fluid Intelligence занимает ~3,5 ГБ ОЗУ |
| Множество моделей на выбор | Fluid Intelligence — closed-source компонент |
| Поддержка 40+ языков | Intel Mac работает только с Whisper |
| Три режима: диктовка, команды, редактирование | Apple Silicon обязателен для лучшей производительности |
| Интеграция с любым приложением через Accessibility API | Нет мобильных клиентов (iOS/Android) |
| Активное сообщество, быстрые обновления | Требует разрешения Accessibility, что пугает некоторых пользователей |
Сравнение с альтернативами
Главный конкурент — Wispr Flow, который отправляет аудио на свои серверы и берёт ежемесячную плату.
| Параметр | FluidVoice | Wispr Flow | Superwhisper |
|---|---|---|---|
| Цена | Бесплатно | $15/мес или $12/мес при оплате за год | $9,99/мес |
| Обработка | Локально (100%) | Только облако | Локально |
| Платформа | macOS 15+ | Mac, Win, iOS, Android | macOS |
| Open Source | ✅ GPLv3 | ❌ | ❌ |
| Поддерживаемых языков | до 99 (Whisper) | 100+ | до 99 (Whisper) |
| AI-улучшение офлайн | ✅ Fluid Intelligence | ❌ | Ограниченно |
| Приватность | Полная | Каждая фраза обрабатывается в облаке | Полная |
Вердикт
FluidVoice — редкий случай, когда бесплатный open-source инструмент не уступает платным конкурентам в удобстве, а по приватности превосходит их всех.
Для пользователя Mac, который пишет, кодирует и работает с промптами весь день, это несложная вещь для попробовать: локальная, приватная, бесплатная и работающая в Cursor и терминале, а не только в приложении для заметок.
Кому особенно подойдёт:
- Разработчикам и дата-аналитикам на Apple Silicon
- Пользователям, работающим с конфиденциальными данными (медицина, юристы, финансы)
- Тем, кто хочет сэкономить на подписках диктовочных сервисов
- Авторам, которым важна скорость набора без облачных задержек
Кому не подойдёт:
- Пользователям Windows или Linux (только macOS)
- Тем, кто сидит на Intel Mac и нуждается в максимальной производительности
- Если нужна диктовка на iPhone или Android
Итоговая оценка: 9/10
| Критерий | Оценка |
|---|---|
| Функциональность | 9/10 |
| Приватность | 10/10 |
| Цена/качество | 10/10 |
| Удобство установки | 9/10 |
| Поддержка языков | 8/10 |
| Экосистема | 7/10 |
Версия на момент обзора: v1.6.x. Репозиторий: github.com/altic-dev/FluidVoice