Question 1

Apakah osFoundry menggunakan Ollama atau llama.cpp?

Accepted Answer

osFoundry menjalankan inference server-nya sendiri. Dari perspektif Anda hanyalah "Install" dan model siap.

Question 2

Berapa banyak RAM yang saya butuhkan?

Accepted Answer

Model Q4 7B membutuhkan ~6 GB. 13B membutuhkan ~10 GB. 70B Q4 membutuhkan ~50 GB.

Question 3

Bisakah saya menjalankan beberapa model lokal sekaligus?

Accepted Answer

Ya — server hot-load on demand dan unload model idle untuk membebaskan memori.

Question 4

Apakah inference lokal ditagih?

Accepted Answer

Tidak. Lokal berjalan pada hardware Anda sendiri dan gratis.