Speech-to-Text
Speech-to-Text — это приложение в каталоге сообщества osFoundry. Самохостинговый сервис распознавания речи на моделях OpenAI Whisper — точное транскрибирование на 90+ языках, диаризация спикеров (опционально), ускоренная инференция с VAD-обрезкой, несколько размеров моделей (tiny → large-v3), REST API + браузерный интерфейс загрузки. На базе Whisper ASR Webservice (ahmetoner/whisper-asr-webservice). CPU подходит для средних моделей; для large и реального времени нужен GPU.
Подробности
- Рабочая область: osfoundry
- Категория: COMMUNICATION
- Цена: Free
- Доступ: Community
Возможности
- Speaker diarization (optional)
- VAD-trimmed faster inference
- Multiple model sizes (tiny → large-v3)
- REST API + browser upload UI
Документация
Документация поддерживается на английском языке основным проектом.
# Speech-to-Text
Self-hosted Whisper transcription, powered by the Whisper ASR Webservice.
## Performance
- **tiny / base** — usable on CPU (real-time-ish)
- **small / medium** — CPU works for batch transcription; GPU for real-time
- **large-v3 / distil-large-v3** — GPU strongly recommended
## Features
- 90+ languages
- Speaker diarization (optional, via pyannote.audio)
- VAD (voice activity detection) to skip silence + speed up batch jobs
- Output formats: JSON, text, SRT, VTT, TSV
- REST API: POST audio file → returns transcript
- Browser upload UI at `/`
## Packaging
Thin wrapper around the official `onerahmet/openai-whisper-asr-webservice` image (CPU variant). Downloaded models cached at `/root/.cache`.
Как использовать Speech-to-Text в osFoundry
Установите Speech-to-Text в свою рабочую область одним кликом, затем сделайте форк в osStudio, чтобы настроить промпты, инструменты или конфигурацию под ваш стек. Любой участник вашей рабочей области сможет продолжить с того места, где вы остановились.
Другие приложения от сообщества
- CRM — Управление взаимоотношениями с клиентами: контакты, сделки и отслеживание воронки продаж.
- Kanban Board — Проектная kanban-доска в стиле Trello с карточками, досками, видами календаря и таблицы и свойствами на доску. На базе Focalboard (отдельный персональный сервер). Встроенный SQLite на постоянном томе.
- Служба поддержки — Сортировка тикетов и входящие сообщения службы поддержки с отслеживанием SLA.
- Page Builder — Визуальный drag-and-drop конструктор страниц с секциями, темами, SEO и публикацией
- Website Builder — Многостраничный конструктор сайтов с CMS-коллекциями, глобальной навигацией, футером, темами и публикацией
- Витрина магазина — Витрина интернет-магазина с каталогом товаров, корзиной и оформлением заказа.