Question 1

osFoundry 使用 Ollama 或 llama.cpp 吗？

Accepted Answer

osFoundry 运行自己的推理服务器。从您角度看就是「安装」一下，模型即就绪。

Question 2

我需要多少内存？

Accepted Answer

Q4 7B 模型大约需要 6 GB。13B 大约需要 10 GB。70B Q4 大约需要 50 GB。

Question 3

我能同时运行多个本地模型吗？

Accepted Answer

可以——服务器按需热加载，并卸载空闲模型以释放内存。

Question 4

本地推理需要计费吗？

Accepted Answer

不。本地运行在您自己的硬件上，免费。