Voice Cloning

Voice Cloning은(는) osFoundry 커뮤니티 카탈로그에 등록된 앱입니다. 생성형 오디오 모델입니다. 음성을 복제하고, 텍스트 프롬프트에서 프로소디 + 비언어적 신호(웃음, 한숨, 망설임)가 있는 음성, 음악, 음향 효과를 생성합니다. Bark(suno-ai)로 구동됩니다. **GPU 강력 권장** — CPU 추론은 문장당 몇 분 걸립니다.

세부 정보

워크스페이스: osfoundry
카테고리: COMMUNICATION
가격: Free
액세스: Community

기능

Generative audio model — clones voices
Generates speech with prosody + non-verbal cues (laughs
Hesitations)
Sound effects from text prompts

문서

문서는 업스트림 프로젝트에서 영어로 관리됩니다.

# Voice Cloning

Generative audio model with voice cloning + prosody + non-verbal cues, powered by Bark.

## ⚠️ GPU strongly recommended
Bark on CPU is **impractically slow** — ~5 minutes per ~10-second sentence. On a modern GPU (>=8 GB VRAM): real-time. For CPU work, use Coqui TTS (#162) which has faster CPU models.

## Features
- Voice cloning from a short sample
- Non-verbal cues: `[laughs]` `[sighs]` `[music]` `[gasps]` `[clears throat]`
- 100+ pre-built speaker prompts across 13 languages
- Music generation from text prompts
- Sound effect generation
- HuggingFace transformers compatible

## Packaging
Thin wrapper around the community `gitmylo/audio-webui` image which bundles Bark + a Gradio UI + a model manager. Bark's models (~5 GB) cached at `/data`.

## CONFIRM-AT-BUILD
There is no official Bark Docker image; we use `gitmylo/audio-webui` (the most maintained community pack). Verify version + entrypoint against pinned tag.

osFoundry에서 Voice Cloning을(를) 사용하는 방법

Voice Cloning을(를) 원클릭으로 워크스페이스에 설치한 다음, osStudio에서 포크하여 프롬프트, 도구 또는 구성을 자신의 스택에 맞게 커스터마이즈하십시오. 워크스페이스의 누구나 작업을 이어받을 수 있습니다.

커뮤니티의 다른 앱

CRM — 연락처, 거래, 파이프라인 추적이 가능한 고객 관계 관리 도구입니다.
Kanban Board — 카드, 보드, 캘린더와 테이블 뷰, 보드별 속성을 갖춘 Trello 스타일 칸반 및 프로젝트 보드입니다. Focalboard (독립 실행형 개인 서버) 기반으로 동작합니다. 영구 볼륨에 내장 SQLite로 제공됩니다.
헬프데스크 — SLA 추적 기능을 갖춘 티켓 분류 및 고객 지원 인박스입니다.
Page Builder — 섹션, 테마, SEO, 게시 기능이 있는 시각적 드래그 앤 드롭 페이지 빌더입니다
Website Builder — CMS 컬렉션, 글로벌 내비게이션, 푸터, 테마, 게시 기능이 있는 다중 페이지 웹사이트 빌더
스토어프론트 — 상품 카탈로그, 장바구니, 결제 기능을 갖춘 이커머스 스토어프론트입니다.