GLM 4.6
Realizzato da Z.ai, GLM 4.6 è un modello chat con una finestra di contesto da 203K token. Compared with GLM-4.5, this generation brings several key improvements: Longer context window: The context window has been expanded from 128K to 200K tokens, enabling the model to handle more complex...
by Z.ai · finestra di contesto da 203K token
Ideale per
- chat e routing a bassa latenza
- instradamento e triage delle richieste
- classificazione di testo
Modi per utilizzare GLM 4.6 in osFoundry
Si colleghi con la sua chiave (BYOK)
Apra la finestra delle chiavi e incolli la sua API key Z.ai. osFoundry scopre GLM 4.6 automaticamente — lo assegni a un ruolo Maestro (router, direct, orchestrator o fallback) nella scheda Pipeline e sarà attivo in ogni chat. La sua chiave, il suo account provider — nessun ricarico sui token.
Lo utilizzi in una Room App
Le Room App dichiarano le funzionalità AI nel loro manifest e le richiamano con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Lo richiami dalle sue applicazioni
Una volta integrato un modello nel suo workspace, può esporlo come API e raggiungerlo dai suoi servizi, script o pipeline CI — al di fuori di osFoundry.
Esegua GLM 4.6 in autonomia
GLM 4.6 è disponibile anche come open weights — lo ospiti in autonomia per il pieno controllo dei dati e nessun costo per token. Consulti quella pagina per i requisiti GPU e un confronto dei costi con i prezzi delle API.
GLM 4.6 a confronto con modelli simili
Licenza
Hosted — usage subject to provider terms — Modello solo in hosting — l'uso è regolato dai termini API del provider. Porti la sua chiave del provider.
Nessun peso distribuito; uso soggetto ai termini del provider.
Domande frequenti su GLM 4.6
Quanto costa GLM 4.6?
GLM 4.6 è tariffato a $ 0.430 /1M per l'input e $ 1.74 /1M per l'output. Porti la sua API key Z.ai — osFoundry applica i prezzi del provider senza ricarico.
Posso usare GLM 4.6 a scopo commerciale?
L'uso commerciale è consentito a determinate condizioni. Modello solo in hosting — l'uso è regolato dai termini API del provider. Porti la sua chiave del provider. Nessun peso distribuito; uso soggetto ai termini del provider.
Qual è la finestra di contesto di GLM 4.6?
GLM 4.6 supporta una finestra di contesto da 203K token.
Posso eseguire GLM 4.6 localmente?
No — GLM 4.6 è disponibile solo in hosting e si accede tramite l'API di Z.ai. È disponibile un equivalente open-weights da ospitare in autonomia — veda il collegamento qui sopra.
In che cosa eccelle GLM 4.6?
GLM 4.6 è particolarmente adatto a chat e routing a bassa latenza, instradamento e triage delle richieste, classificazione di testo.
Come utilizzo GLM 4.6 in osFoundry?
Incolli la sua API key Z.ai nella finestra delle chiavi (oppure distribuisca i pesi aperti per i modelli auto-ospitabili), assegni GLM 4.6 a un ruolo Maestro nella scheda Pipeline, quindi lo utilizzi in chat, nelle Room App tramite invokeAI o nelle sue applicazioni.
Pubblicato da Z.ai il 30 settembre 2025. Fonte: https://openrouter.ai/z-ai/glm-4.6