AI Talking Avatar
AI Talking Avatar は osFoundry コミュニティカタログのアプリです。1枚のソース画像と音声クリップから、しゃべるヘッド動画を生成します。静止画のポートレートに音声をリップシンクさせます。SadTalkerを利用しています。**⚠️ GPUを強く推奨(8GB以上のVRAM)。CPUでも動作しますが低速(実時間の約10倍)です。**
詳細
- ワークスペース: osfoundry
- カテゴリ: COMMUNICATION
- 料金: Free
- アクセス: Community
ドキュメント
ドキュメントは上流プロジェクトにより英語で管理されています。
# AI Talking Avatar
Generate talking-head videos from one photo + one audio file, powered by SadTalker.
## ⚠️ GPU recommended
CPU works but takes ~10× real-time per generated second (a 30-second clip = ~5 minutes of compute). GPU (8+ GB VRAM) brings it under real-time.
## How it works
1. Upload a source portrait image (any face photo)
2. Upload an audio file (TTS output, voice recording, music with vocals)
3. SadTalker animates the portrait's mouth + eyes + head to match the audio
4. Download the MP4
## Features
- Single image + single audio → MP4
- Configurable head motion + expression scale
- Optional reference video for motion style
- 256px and 512px output
- Enhanced mode (slower, better quality)
- Pair with TTS apps (#162 Coqui / #163 Bark) for end-to-end text-to-talking-head
## Packaging
Based on the community `taylorai/sadtalker-webui` image. Models cached at `/data`.
## CONFIRM-AT-BUILD
Pin to a specific SadTalker fork — upstream OpenTalker/SadTalker isn't actively maintained for new model weights; check community variants.
osFoundry での AI Talking Avatar の使い方
AI Talking Avatar をワンクリックでワークスペースにインストールし、osStudio でフォークしてプロンプト、ツール、または構成をご自身のスタックに合わせてカスタマイズできます。ワークスペース内のメンバーは誰でも、続きの作業を引き継げます。
コミュニティの他のアプリ
- CRM — 連絡先、商談、パイプライン管理を備えた顧客関係管理ツールです。
- Kanban Board — カード、ボード、カレンダー・テーブルビュー、ボードごとのプロパティを備えた、Trello風のカンバン・プロジェクトボードです。Focalboard(スタンドアロン個人サーバー)を基盤としています。永続ボリューム上に組み込みSQLiteを持ちます。
- ヘルプデスク — SLA トラッキング付きのチケットトリアージとカスタマーサポート受信箱です。
- Page Builder — セクション、テーマ、SEO、公開機能を備えた、ビジュアルなドラッグ&ドロップのページビルダーです
- Website Builder — CMS コレクション、グローバルナビゲーション、フッター、テーマ、公開機能を備えたマルチページの Web サイトビルダーです
- ストアフロント — 商品カタログ、カート、チェックアウトを備えた EC ストアフロントです。