Question 1

osFoundryはOllamaやllama.cppを使っていますか?

Accepted Answer

osFoundryは独自の推論サーバーを動かしています。あなたから見ると「インストール」を押すだけで、モデルが利用可能になります。

Question 2

どのくらいのRAMが必要ですか?

Accepted Answer

Q4の7Bモデルは約6 GB、13Bは約10 GB、70B Q4は約50 GB必要です。

Question 3

複数のローカルモデルを同時に動かせますか?

Accepted Answer

はい — サーバーは必要に応じてホットロードし、アイドル中のモデルをアンロードしてメモリを解放します。

Question 4

ローカル推論は課金されますか?

Accepted Answer

いいえ。ローカルは自身のハードウェアで動き、無料です。