Text-to-Speech
Text-to-Speech은(는) osFoundry 커뮤니티 카탈로그에 등록된 앱입니다. 셀프호스트 텍스트-음성 변환 서버입니다. XTTS-v2(6초 샘플에서 음성 복제), Tacotron 2, FastSpeech 2, VITS를 포함한 고품질 다국어 TTS 모델을 제공합니다. REST API + 브라우저 플레이그라운드를 갖추고 있습니다. Coqui TTS로 구동됩니다. CPU(더 느림) 또는 GPU(실시간)에서 실행됩니다.
세부 정보
- 워크스페이스: osfoundry
- 카테고리: COMMUNICATION
- 가격: Free
- 액세스: Community
기능
문서
문서는 업스트림 프로젝트에서 영어로 관리됩니다.
# Text-to-Speech
Self-hosted TTS server, powered by Coqui TTS.
## ⚠️ GPU recommended for real-time
Coqui's older models (Tacotron 2, FastSpeech 2, VITS) run reasonably on CPU. XTTS-v2 (the popular voice-cloning model) needs a GPU for real-time inference. CPU XTTS works but is ~10× slower than real time.
## Features
- 1,100+ pre-trained models across 16+ languages
- XTTS-v2: clone a voice from a 6-second sample
- Voice conversion (transform a voice into another)
- Streaming output (sentence-by-sentence)
- REST API: `/api/tts?text=hello&speaker_idx=0`
- Browser playground at `/`
## Packaging
Thin wrapper around the official `ghcr.io/coqui-ai/tts-cpu` image (no torch-CUDA, smaller). Downloaded models cached at `/root/.local/share/tts` (30 GB volume — XTTS-v2 is ~2 GB, the full model zoo can fill the volume).
osFoundry에서 Text-to-Speech을(를) 사용하는 방법
Text-to-Speech을(를) 원클릭으로 워크스페이스에 설치한 다음, osStudio에서 포크하여 프롬프트, 도구 또는 구성을 자신의 스택에 맞게 커스터마이즈하십시오. 워크스페이스의 누구나 작업을 이어받을 수 있습니다.
커뮤니티의 다른 앱
- CRM — 연락처, 거래, 파이프라인 추적이 가능한 고객 관계 관리 도구입니다.
- Kanban Board — 카드, 보드, 캘린더와 테이블 뷰, 보드별 속성을 갖춘 Trello 스타일 칸반 및 프로젝트 보드입니다. Focalboard (독립 실행형 개인 서버) 기반으로 동작합니다. 영구 볼륨에 내장 SQLite로 제공됩니다.
- 헬프데스크 — SLA 추적 기능을 갖춘 티켓 분류 및 고객 지원 인박스입니다.
- Page Builder — 섹션, 테마, SEO, 게시 기능이 있는 시각적 드래그 앤 드롭 페이지 빌더입니다
- Website Builder — CMS 컬렉션, 글로벌 내비게이션, 푸터, 테마, 게시 기능이 있는 다중 페이지 웹사이트 빌더
- 스토어프론트 — 상품 카탈로그, 장바구니, 결제 기능을 갖춘 이커머스 스토어프론트입니다.