Question 1

osFoundry는 Ollama 또는 llama.cpp를 사용합니까?

Accepted Answer

osFoundry는 자체 추론 서버를 실행합니다. 사용자 관점에서는 "설치"만 하면 모델이 준비됩니다.

Question 2

얼마나 많은 RAM이 필요합니까?

Accepted Answer

Q4 7B 모델은 ~6GB가 필요합니다. 13B는 ~10GB가 필요합니다. 70B Q4는 ~50GB가 필요합니다.

Question 3

한 번에 여러 로컬 모델을 실행할 수 있습니까?

Accepted Answer

예 — 서버는 요구에 따라 핫로드하고 유휴 모델을 언로드하여 메모리를 확보합니다.

Question 4

로컬 추론은 청구됩니까?

Accepted Answer

아니요. 로컬은 자체 하드웨어에서 실행되며 무료입니다.