FluidVoice: самый быстрый офлайн-диктовщик для macOS — и бесплатно

«Большинство полированных приложений диктовки отправляют текст в облако. FluidVoice работает иначе — всё локально, ноль данных покидает ваш Mac.»

FluidVoice — это open-source приложение для голосового ввода на macOS с AI-улучшением прямо на устройстве. Оно построено на движке FluidAudio и широко позиционируется как бесплатная приватная альтернатива Wispr Flow; на момент написания репозиторий набрал около 2 600 звёзд на GitHub и более 25 000 загрузок.

Что это и для кого

FluidVoice — нативное macOS-приложение: нажмите хоткей, говорите, и текст появляется прямо в Notes, Slack, Cursor, Gmail или любом текстовом поле. Локальный AI держит голос на устройстве. Приложение создано для высокоскоростной транскрипции с приоритетом приватности — диктуйте напрямую в любое активное текстовое поле, не отправляя аудиоданные в облако.

Кому подойдёт:

  • Разработчикам и техническим специалистам, работающим с конфиденциальными данными
  • Авторам и журналистам, которые ценят скорость и приватность
  • Пользователям Apple Silicon, желающим выжать максимум из процессора
  • Всем, кто устал платить подписку за диктовку
ℹ Системные требования
FluidVoice требует macOS 15.0 Sequoia или новее, а также разрешений на доступ к микрофону и специальные возможности (Accessibility) для ввода в другие приложения. Intel Mac поддерживается через модели Whisper.

Установка

Установить через Homebrew можно одной командой:

brew install --cask fluidvoice

После установки FluidVoice проведёт вас через онбординг:


graph TD
    A[Установить FluidVoice] --> B[Выдать права: микрофон + Accessibility]
    B --> C[Выбрать глобальный хоткей]
    C --> D[Выбрать речевую модель]
    D --> E{Хотите AI-улучшение?}
    E -->|Да, локально| F[Скачать Fluid Intelligence ~3.5 ГБ]
    E -->|Да, облако| G[Добавить API-ключ OpenAI / Groq]
    E -->|Нет| H[Готово к работе]
    F --> H
    G --> H

Достаточно задать глобальный хоткей в настройках и пройти онбординг — выбрать голосовую модель под ваш язык и требования к скорости. Модели варьируются от Apple Speech (без загрузки) до высокоточных Nemotron и Whisper.

Ключевые возможности

1. Множество речевых моделей

Линейка моделей охватывает Nemotron Speech 3.5, Parakeet Flash, Parakeet TDT v3/v2, Cohere Transcribe, Apple Speech и Whisper — с оптимизированной маршрутизацией для коротких и длинных сессий.

МодельЯзыкиОсобенность
Nemotron Speech 3.5 Ultra~40Минимальная задержка
Parakeet Flash (Beta)Только ENБыстрейший, стриминг
Parakeet TDT v325Оптимизирован под Apple Silicon
Cohere Transcribe14Точность пунктуации и чисел
Apple SpeechСистемныеБез загрузки
Whisper (Tiny→Large)до 99Максимальный охват языков

2. Fluid Intelligence — локальный AI-слой

Fluid Intelligence — отдельный, приватно поддерживаемый локальный AI-рантайм, который обеспечивает продвинутое улучшение диктовки прямо на устройстве: умное форматирование, контекстно-зависимую капитализацию и постобработку.

Модель обучена на более чем 100 000 точках данных диктовки; для работы требует ~3,5 ГБ дискового пространства и ~3,5 ГБ ОЗУ.

💡 Совет
Fluid Intelligence добавляет полностью локальный приватный AI-слой для тех, кто хочет улучшение на устройстве без отправки данных куда-либо. Если ОЗУ ограничено, можно пользоваться приложением без неё — базовая диктовка отлично работает сама по себе.

3. Три режима работы

Write Mode, Command Mode и Direct Dictation — переключайтесь между контекстами мгновенно.

  • Direct Dictation — текст вставляется прямо в активное поле
  • Write Mode — переписать выделенный текст или создать новый контент в любом текстовом поле с помощью голосовых инструкций
  • Command Mode — выполнять команды в терминале, управлять нативными macOS-приложениями и автоматизировать задачи голосом

4. Скорость

Архитектура на основе CoreML и Metal достигает воспринимаемой задержки менее 100 мс и коэффициента реального времени 3 380×, позволяя обрабатывать почти час речи за одну секунду.

Речь примерно в 3,7 раза быстрее набора текста — это около 9 минут экономии на каждые 500 слов.

5. Адаптивный тон под приложение

FluidVoice определяет, какое приложение активно, и автоматически выбирает подходящий тональный профиль. Fluid-1 переписывает ваши слова в соответствии с контекстом, не меняя смысла.

6. История аудио и статистика

Опциональная локальная история аудио с бюджетными ограничениями и экспортом в ZIP — найти в Preferences → Audio History. Также доступна статистика использования за день с карточкой в шапке и пиллом в панели инструментов.

7. Опциональная облачная интеграция

При желании можно подключить собственный API-ключ OpenAI, Groq или другого провайдера для облачного улучшения. Ключи хранятся в macOS Keychain.

📝 Пример использования
Вы кодируете в Cursor, нажимаете хоткей и проговариваете: «Напиши функцию, которая сортирует массив по убыванию». FluidVoice транскрибирует, Command Mode отправляет запрос — и через секунду текст уже в редакторе. Без единого облачного запроса.

Тарифы и цены

Проект полностью бесплатен и опубликован под лицензией GPLv3.

ЧтоСтоимость
Базовое приложениеБесплатно (GPLv3)
Fluid Intelligence (локальный AI)Бесплатно, ~3,5 ГБ загрузка
Облачный AI (OpenAI, Groq)По тарифам провайдера (ключ ваш)

Если FluidVoice делает ваш день чуть лучше, вы можете поддержать его разработку через GitHub Sponsors.

Плюсы и минусы

✅ Плюсы❌ Минусы
Полностью бесплатен и open-source (GPLv3)Только macOS 15.0+
Весь AI на устройстве, данные не покидают MacFluid Intelligence занимает ~3,5 ГБ ОЗУ
Множество моделей на выборFluid Intelligence — closed-source компонент
Поддержка 40+ языковIntel Mac работает только с Whisper
Три режима: диктовка, команды, редактированиеApple Silicon обязателен для лучшей производительности
Интеграция с любым приложением через Accessibility APIНет мобильных клиентов (iOS/Android)
Активное сообщество, быстрые обновленияТребует разрешения Accessibility, что пугает некоторых пользователей

Сравнение с альтернативами

Главный конкурент — Wispr Flow, который отправляет аудио на свои серверы и берёт ежемесячную плату.

ПараметрFluidVoiceWispr FlowSuperwhisper
ЦенаБесплатно$15/мес или $12/мес при оплате за год$9,99/мес
ОбработкаЛокально (100%)Только облакоЛокально
ПлатформаmacOS 15+Mac, Win, iOS, AndroidmacOS
Open Source✅ GPLv3
Поддерживаемых языковдо 99 (Whisper)100+до 99 (Whisper)
AI-улучшение офлайн✅ Fluid IntelligenceОграниченно
ПриватностьПолнаяКаждая фраза обрабатывается в облакеПолная
⚠ Важно о Wispr Flow
Бесплатный тариф Wispr Flow ограничен 2 000 словами в неделю. При интенсивном использовании это лимит примерно на 4 дня — после чего нужна подписка. Wispr Flow Pro обойдётся в $432 за три года при оплате по годовому плану.

Вердикт

FluidVoice — редкий случай, когда бесплатный open-source инструмент не уступает платным конкурентам в удобстве, а по приватности превосходит их всех.

Для пользователя Mac, который пишет, кодирует и работает с промптами весь день, это несложная вещь для попробовать: локальная, приватная, бесплатная и работающая в Cursor и терминале, а не только в приложении для заметок.

Кому особенно подойдёт:

  • Разработчикам и дата-аналитикам на Apple Silicon
  • Пользователям, работающим с конфиденциальными данными (медицина, юристы, финансы)
  • Тем, кто хочет сэкономить на подписках диктовочных сервисов
  • Авторам, которым важна скорость набора без облачных задержек

Кому не подойдёт:

  • Пользователям Windows или Linux (только macOS)
  • Тем, кто сидит на Intel Mac и нуждается в максимальной производительности
  • Если нужна диктовка на iPhone или Android

Итоговая оценка: 9/10

КритерийОценка
Функциональность9/10
Приватность10/10
Цена/качество10/10
Удобство установки9/10
Поддержка языков8/10
Экосистема7/10

Версия на момент обзора: v1.6.x. Репозиторий: github.com/altic-dev/FluidVoice