Question 1

Puis-je continuer à utiliser llama.cpp en dessous ?

Accepted Answer

osFoundry a son propre runtime d’inférence — vous n’avez pas besoin de llama.cpp. Si vous êtes engagé sur un runtime personnalisé, le chemin BYO-VPC / BYO-serveur permet de pointer Maestro vers votre propre endpoint.

Question 2

osFoundry est-il aussi personnalisable qu’un stack DIY ?

Accepted Answer

Pour les points d’intégration (prompts, récupération, routage, post-hooks, outils), oui — via les plugins osStudio. Pour les internes du runtime (gestion KV-cache, kernels d’attention) — non, c’est opiniâtre.

Question 3

Est-ce que je contrôle toujours mes données ?

Accepted Answer

Oui. Le mode local-first garde tout sur l’appareil. BYO-VPC est disponible pour entreprise. Les modèles open-weight signifient pas de verrouillage propriétaire.

Question 4

Et le coût ?

Accepted Answer

Pour un usage local uniquement, osFoundry est gratuit. Pour les fonctionnalités équipe / cloud, vous payez par seconde de calcul et par Go de stockage — généralement 60 à 90 % moins que d’exécuter l’infrastructure DIY équivalente au même uptime, une fois que vous prenez en compte le temps d’opérations.

Question 5

Les plugins osFoundry peuvent-ils remplacer mon code personnalisé ?

Accepted Answer

Pour la plupart des modèles, oui. Étapes de récupération, post-hooks, règles de routage, commandes personnalisées, UI d’outils, et guards d’espace de travail ont tous un slot de plugin. Écrivez le même TypeScript que vous écririez dans une intégration personnalisée, livrez-le comme plugin, partagez-le.

Question 6

Le catalogue communautaire est-il réellement utile ?

Accepted Answer

De plus en plus — apps, agents, serveurs MCP, prompts, pipelines de récupération sont déjà partageables. La qualité varie ; install-and-fork est le flux de travail.