Início / Glossário / LLM
What is Large Language Model?
Abbreviation: LLM
Um large language model (LLM, ou grande modelo de linguagem) é uma rede neural treinada em vastos corpora de texto para prever o próximo token, produzindo saída fluente em linguagem natural. O osFoundry roteia requisições entre mais de 100 LLMs de qualquer provedor — local, em nuvem ou self-hosted.
Detail
LLMs são redes neurais baseadas em transformers que variam de ~1B a mais de 1T parâmetros. Eles alimentam chat, geração de código, sumarização, tradução e a maior parte da IA agêntica hoje. A qualidade varia conforme os dados de treinamento, arquitetura e pós-treinamento (RLHF, DPO).
LLMs vêm em dois modos de distribuição: closed-source (acessados apenas via API — por exemplo, GPT-4, Claude) e open-weight (baixáveis para self-hosting — por exemplo, Llama, Mistral, Qwen). O catálogo do osFoundry indexa 76.000 modelos de pesos abertos mais 364 modelos de API hospedada.
How osFoundry approaches Large Language Model
O osFoundry trata cada LLM como um backend intercambiável. Traga sua própria chave de API (BYOK) para modelos hospedados; instale modelos de pesos abertos para inferência local; implante endpoints de GPU dedicados para capacidade reservada. O Maestro roteia por requisição com base em regras que você define no osStudio.
FAQ
Como o osFoundry se relaciona com LLMs?
O osFoundry é a camada de orquestração acima dos LLMs. Ele não faz LLMs — ele permite rotear requisições entre LLMs locais, em nuvem e self-hosted a partir de um único workspace.
Qual LLM é melhor?
Nenhum LLM é o melhor em tudo. O osFoundry permite testar diferentes LLMs em A/B por workload e rotear conforme a necessidade.
Posso usar vários LLMs em um único chat?
Sim. O Maestro pode trocar modelos no meio da conversa com base em regras de roteamento do osStudio.
Related terms
Related features