Text-to-Speech
Text-to-Speech は osFoundry コミュニティカタログのアプリです。セルフホスト型の音声合成サーバーです。XTTS-v2(6 秒のサンプルからの音声クローン)、Tacotron 2、FastSpeech 2、VITS など、高品質な多言語 TTS モデルを備えます。REST API +ブラウザプレイグラウンドに対応します。Coqui TTS を採用しています。CPU でも動作しますが(低速)、リアルタイムには GPU が適しています。
詳細
- ワークスペース: osfoundry
- カテゴリ: COMMUNICATION
- 料金: Free
- アクセス: Community
機能
ドキュメント
ドキュメントは上流プロジェクトにより英語で管理されています。
# Text-to-Speech
Self-hosted TTS server, powered by Coqui TTS.
## ⚠️ GPU recommended for real-time
Coqui's older models (Tacotron 2, FastSpeech 2, VITS) run reasonably on CPU. XTTS-v2 (the popular voice-cloning model) needs a GPU for real-time inference. CPU XTTS works but is ~10× slower than real time.
## Features
- 1,100+ pre-trained models across 16+ languages
- XTTS-v2: clone a voice from a 6-second sample
- Voice conversion (transform a voice into another)
- Streaming output (sentence-by-sentence)
- REST API: `/api/tts?text=hello&speaker_idx=0`
- Browser playground at `/`
## Packaging
Thin wrapper around the official `ghcr.io/coqui-ai/tts-cpu` image (no torch-CUDA, smaller). Downloaded models cached at `/root/.local/share/tts` (30 GB volume — XTTS-v2 is ~2 GB, the full model zoo can fill the volume).
osFoundry での Text-to-Speech の使い方
Text-to-Speech をワンクリックでワークスペースにインストールし、osStudio でフォークしてプロンプト、ツール、または構成をご自身のスタックに合わせてカスタマイズできます。ワークスペース内のメンバーは誰でも、続きの作業を引き継げます。
コミュニティの他のアプリ
- CRM — 連絡先、商談、パイプライン管理を備えた顧客関係管理ツールです。
- Kanban Board — カード、ボード、カレンダー・テーブルビュー、ボードごとのプロパティを備えた、Trello風のカンバン・プロジェクトボードです。Focalboard(スタンドアロン個人サーバー)を基盤としています。永続ボリューム上に組み込みSQLiteを持ちます。
- ヘルプデスク — SLA トラッキング付きのチケットトリアージとカスタマーサポート受信箱です。
- Page Builder — セクション、テーマ、SEO、公開機能を備えた、ビジュアルなドラッグ&ドロップのページビルダーです
- Website Builder — CMS コレクション、グローバルナビゲーション、フッター、テーマ、公開機能を備えたマルチページの Web サイトビルダーです
- ストアフロント — 商品カタログ、カート、チェックアウトを備えた EC ストアフロントです。