Voice Cloning
Voice Cloning ist ein App im osFoundry Community-Katalog. Generatives Audio-Modell — klont Stimmen, generiert Sprache mit Prosodie + nonverbalen Hinweisen (Lachen, Seufzen, Zögern), Musik und Soundeffekte aus Text-Prompts. Betrieben von Bark (suno-ai). **GPU dringend empfohlen** — CPU-Inferenz dauert Minuten pro Satz.
Details
- Workspace: osfoundry
- Kategorie: COMMUNICATION
- Preis: Free
- Zugriff: Community
Funktionen
- Generative audio model — clones voices
- Generates speech with prosody + non-verbal cues (laughs
- Hesitations)
- Sound effects from text prompts
Dokumentation
Die Dokumentation wird vom Upstream-Projekt auf Englisch gepflegt.
# Voice Cloning
Generative audio model with voice cloning + prosody + non-verbal cues, powered by Bark.
## ⚠️ GPU strongly recommended
Bark on CPU is **impractically slow** — ~5 minutes per ~10-second sentence. On a modern GPU (>=8 GB VRAM): real-time. For CPU work, use Coqui TTS (#162) which has faster CPU models.
## Features
- Voice cloning from a short sample
- Non-verbal cues: `[laughs]` `[sighs]` `[music]` `[gasps]` `[clears throat]`
- 100+ pre-built speaker prompts across 13 languages
- Music generation from text prompts
- Sound effect generation
- HuggingFace transformers compatible
## Packaging
Thin wrapper around the community `gitmylo/audio-webui` image which bundles Bark + a Gradio UI + a model manager. Bark's models (~5 GB) cached at `/data`.
## CONFIRM-AT-BUILD
There is no official Bark Docker image; we use `gitmylo/audio-webui` (the most maintained community pack). Verify version + entrypoint against pinned tag.
Voice Cloning in osFoundry verwenden
Installieren Sie Voice Cloning mit einem Klick in Ihren Workspace und forken Sie es anschließend in osStudio, um Prompts, Tools oder die Konfiguration an Ihren Stack anzupassen. Alle Mitglieder Ihres Workspace können dort weitermachen, wo Sie aufgehört haben.
Weitere apps aus der Community
- CRM — Kundenbeziehungsmanagement mit Kontakten, Deals und Pipeline-Tracking.
- Kanban Board — Ein Kanban- und Projekt-Board im Trello-Stil mit Karten, Boards, Kalender- und Tabellenansichten und Eigenschaften pro Board. Basiert auf Focalboard (Standalone Personal Server). Eingebettetes SQLite auf einem persistenten Volume.
- Helpdesk — Ticket-Triage und Kundensupport-Postfach mit SLA-Tracking.
- Page Builder — Visueller Drag-and-Drop-Page-Builder mit Sections, Themes, SEO und Publishing
- Website Builder — Mehrseitiger Website-Builder mit CMS-Collections, globaler Navigation, Footer, Themes und Publishing
- Storefront — E-Commerce-Storefront mit Produktkatalog, Warenkorb und Checkout.