Text-to-Speech
Text-to-Speech 是 osFoundry 社区目录中的应用。自托管文字转语音服务器 —— 高质量多语言 TTS 模型,包括 XTTS-v2(6 秒样本即可声音克隆)、Tacotron 2、FastSpeech 2、VITS。REST API + 浏览器演练场。基于 Coqui TTS 构建。运行于 CPU(较慢)或 GPU(实时)。
详情
- 工作区: osfoundry
- 分类: COMMUNICATION
- 价格: Free
- 访问权限: Community
功能
文档
文档由上游项目以英文维护。
# Text-to-Speech
Self-hosted TTS server, powered by Coqui TTS.
## ⚠️ GPU recommended for real-time
Coqui's older models (Tacotron 2, FastSpeech 2, VITS) run reasonably on CPU. XTTS-v2 (the popular voice-cloning model) needs a GPU for real-time inference. CPU XTTS works but is ~10× slower than real time.
## Features
- 1,100+ pre-trained models across 16+ languages
- XTTS-v2: clone a voice from a 6-second sample
- Voice conversion (transform a voice into another)
- Streaming output (sentence-by-sentence)
- REST API: `/api/tts?text=hello&speaker_idx=0`
- Browser playground at `/`
## Packaging
Thin wrapper around the official `ghcr.io/coqui-ai/tts-cpu` image (no torch-CUDA, smaller). Downloaded models cached at `/root/.local/share/tts` (30 GB volume — XTTS-v2 is ~2 GB, the full model zoo can fill the volume).
如何在 osFoundry 中使用 Text-to-Speech
一键将 Text-to-Speech 安装到您的工作区,然后在 osStudio 中将其分支,针对您的技术栈自定义提示词、工具或配置。工作区中的任何人都可以接续您的工作继续推进。
社区中的其他应用
- 客户关系管理 — 客户关系管理工具,支持联系人、交易和销售管道跟踪。
- Kanban Board — Trello 风格的看板与项目板,含卡片、面板、日历与表格视图以及每面板属性。基于 Focalboard(独立个人服务器)构建。在持久卷上内嵌 SQLite。
- 服务台 — 工单分流与客户支持收件箱,附带 SLA 跟踪。
- Page Builder — 可视化拖放页面生成器,支持区块、主题、SEO 与发布
- Website Builder — 带 CMS 合集、全局导航、页脚、主题与发布的多页面网站生成器
- 店面 — 电商店面,包含商品目录、购物车和结账流程。