GLM 5
GLM 5 (Z.ai, 2026) é um modelo de chat. GLM-5 is Z.ai’s flagship open-source foundation model engineered for complex systems design and long-horizon agent workflows. Built for expert developers, it delivers production-grade performance on large-scale programming tasks, rivaling leading...
by Z.ai · janela de contexto de 203K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar GLM 5 no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da Z.ai. O osFoundry descobre GLM 5 automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute GLM 5 por conta própria
GLM 5 também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
GLM 5 vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| GLM 5 | Z.ai | — | 203K | $ 0.600 /1M | Apenas API |
| MiniMax M2.5 | MiniMax | — | 197K | $ 0.150 /1M | Apenas API |
| Qwen3 Max Thinking | Qwen | — | 262K | $ 0.780 /1M | Apenas API |
| Aion-2.0 | AionLabs | — | 131K | $ 0.800 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre GLM 5
Quanto custa GLM 5?
GLM 5 é cobrado a $ 0.600 /1M para entrada e $ 1.92 /1M para saída. Use sua própria chave de API da Z.ai — o osFoundry repassa o preço do provedor sem markup.
Posso usar GLM 5 comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de GLM 5?
GLM 5 suporta uma janela de contexto de 203K tokens.
Posso rodar GLM 5 localmente?
Não — GLM 5 é somente hospedado e acessado via API da Z.ai. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que GLM 5 é melhor?
GLM 5 é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso GLM 5 no osFoundry?
Cole sua chave de API da Z.ai no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua GLM 5 a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela Z.ai em 11 de fevereiro de 2026. Fonte: https://openrouter.ai/z-ai/glm-5