ホーム / 機能 / 学習・ファインチューニング / LoRAファインチューニング
osFoundryでLlama、Mistral、QwenをLoRAでファインチューニング
osFoundryは、任意のオープンウェイトベースモデルを自身のデータでLoRAまたはQLoRAでファインチューニングします — ノートブック不要、コマンドライン不要。ベースを選び、データセット(KB、アップロード、公開データセット)を指定し、LoRAランクを設定して学習。学習完了の瞬間にアダプターはモデルカタログに登録され、MaestroとRoom Appから即時ルーティング可能になります。
Quick answer
- 60以上のオープンウェイトベースモデルでのLoRA + QLoRA。
- KB、JSONL/CSVアップロード、25万件の公開データセットで学習。
- UI主導 — ノートブック不要。
- 学習完了と同時にアダプターがワークスペースでルーティング可能。
Key capabilities
- 60以上のサポート対象ベースモデル(Llama 3、Mistral、Qwen、Phi、Gemmaなど)。
- LoRA + QLoRAフロー。ランク8/16/32/64を選択可能。
- KB(自動フォーマット)、JSONL/CSV/parquet、25万件の公開データセットで学習。
- 3つのランタイム: ローカルGPU、osFoundryクラウド、自身のインフラ。
- Nステップごとのチェックポイント — 中断したジョブを最後のチェックポイントから再開。
- アダプターエクスポート: 完全な学習設定込みの.safetensors。
How to do it in osFoundry
- ベース+LoRAターゲットを選ぶ — ベースモデルを選びます。LoRAランク、学習率、エポック数、対象モジュールを設定。多くの場合、デフォルトで十分です。
- データセットを指定 — KB(自動で指示ペア形式)を選ぶ、JSONLをアップロード、または公開データセットから選びます。
- 学習を実行 — ランタイム(ローカル/クラウド/BYO)を選び、学習中の損失曲線をライブで観察します。
- アダプターをホットスワップ — 学習完了時、アダプターをデプロイ済みのベースモデルエンドポイントへホットスワップ。同じハンドル、新しい挙動。
Use cases
- カスタマーサポート: 過去のチケットでMistral 7BをLoRAチューニング。エージェントは自社のトーンと製品知識で応答するようになります。
- リーガルチーム: ラベル付き契約でLlama 3.1 8Bを学習。事務所のスタイルで新規ドキュメントをオンプレでレッドライニング。
- ゲームスタジオ: キャラクターごとのLoRAを1つのベースモデルにホットスワップ。1つのGPUで多数の個性あるNPCの声を表現できます。
Frequently asked questions
LoRAファインチューニングはどのくらいかかりますか?
7Bモデルを5万行で: A100で約30分。70Bで約3時間。コンシューマー向けM2/M3 Macで7Bが約2時間。
ランクはいくつを使うべきですか?
まずランク16から。難しいドメインシフトには32や64に上げ、スタイル調整なら8に下げます。
自身のナレッジベースで学習できますか?
はい — KBは自動で指示ペア形式にフォーマットされます。
アダプターをエクスポートできますか?
はい — 完全な学習設定込みの.safetensorsをダウンロード可能。osFoundry外でもデプロイできます。
QLoRAはサポートされていますか?
はい — QLoRAはベースを4ビットに量子化してVRAMを削減します。GPUメモリが厳しい場合、学習設定でQLoRAを選んでください。
結果はどう評価しますか?
side-by-side比較ビューで、評価セット上のアダプターとベースを比較。品質があなたの基準を超えたら昇格させます。
Pricing
ローカル: 無料。クラウド: GPU秒単位課金。A100上の7B LoRAは1回あたり約2〜3ドル、70Bは20〜30ドル。
Related features