Question 1

Использует ли osFoundry Ollama или llama.cpp?

Accepted Answer

osFoundry запускает свой собственный сервер инференса. С вашей точки зрения это просто «Install», и модель готова.

Question 2

Сколько RAM мне нужно?

Accepted Answer

Модель Q4 7B требует ~6 ГБ. 13B требует ~10 ГБ. 70B Q4 требует ~50 ГБ.

Question 3

Могу ли я запустить несколько локальных моделей одновременно?

Accepted Answer

Да — сервер горячо загружает по требованию и выгружает простаивающие модели, чтобы освободить память.

Question 4

Тарифицируется ли локальный инференс?

Accepted Answer

Нет. Локальный запуск на вашем собственном оборудовании, бесплатно.