Voice Cloning
Voice Cloning 是 osFoundry 社区目录中的应用。生成式音频模型 —— 克隆声音、生成带韵律 + 非语言提示(笑声、叹息、犹豫)的语音、音乐以及来自文本提示词的音效。基于 Bark(suno-ai)构建。**强烈建议使用 GPU** —— CPU 推理每句话需要数分钟。
详情
- 工作区: osfoundry
- 分类: COMMUNICATION
- 价格: Free
- 访问权限: Community
功能
- Generative audio model — clones voices
- Generates speech with prosody + non-verbal cues (laughs
- Hesitations)
- Sound effects from text prompts
文档
文档由上游项目以英文维护。
# Voice Cloning
Generative audio model with voice cloning + prosody + non-verbal cues, powered by Bark.
## ⚠️ GPU strongly recommended
Bark on CPU is **impractically slow** — ~5 minutes per ~10-second sentence. On a modern GPU (>=8 GB VRAM): real-time. For CPU work, use Coqui TTS (#162) which has faster CPU models.
## Features
- Voice cloning from a short sample
- Non-verbal cues: `[laughs]` `[sighs]` `[music]` `[gasps]` `[clears throat]`
- 100+ pre-built speaker prompts across 13 languages
- Music generation from text prompts
- Sound effect generation
- HuggingFace transformers compatible
## Packaging
Thin wrapper around the community `gitmylo/audio-webui` image which bundles Bark + a Gradio UI + a model manager. Bark's models (~5 GB) cached at `/data`.
## CONFIRM-AT-BUILD
There is no official Bark Docker image; we use `gitmylo/audio-webui` (the most maintained community pack). Verify version + entrypoint against pinned tag.
如何在 osFoundry 中使用 Voice Cloning
一键将 Voice Cloning 安装到您的工作区,然后在 osStudio 中将其分支,针对您的技术栈自定义提示词、工具或配置。工作区中的任何人都可以接续您的工作继续推进。
社区中的其他应用
- 客户关系管理 — 客户关系管理工具,支持联系人、交易和销售管道跟踪。
- Kanban Board — Trello 风格的看板与项目板,含卡片、面板、日历与表格视图以及每面板属性。基于 Focalboard(独立个人服务器)构建。在持久卷上内嵌 SQLite。
- 服务台 — 工单分流与客户支持收件箱,附带 SLA 跟踪。
- Page Builder — 可视化拖放页面生成器,支持区块、主题、SEO 与发布
- Website Builder — 带 CMS 合集、全局导航、页脚、主题与发布的多页面网站生成器
- 店面 — 电商店面,包含商品目录、购物车和结账流程。