GLM 4.7 Flash
Conçu par Z.ai, GLM 4.7 Flash est un modèle chat avec une fenêtre de contexte de 203K tokens. As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...
by Z.ai · fenêtre de contexte de 203K tokens
Idéal pour
- chat et routage à faible latence
- routage et triage des requêtes
- classification de texte
Comment utiliser GLM 4.7 Flash dans osFoundry
Connectez-vous avec votre propre clé (BYOK)
Ouvrez la fenêtre de clés et collez votre clé API Z.ai. osFoundry détecte automatiquement GLM 4.7 Flash — assignez-le à un rôle Maestro (router, direct, orchestrator ou fallback) dans l'onglet Pipeline et il est actif dans chaque conversation. Votre clé, votre compte fournisseur — sans majoration sur les tokens.
Utilisez-le dans une Room App
Les Room Apps déclarent leurs fonctionnalités IA dans leur manifeste, puis les appellent via invokeAI :
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Appelez-le depuis vos propres applications
Une fois un modèle intégré à votre espace de travail, vous pouvez l'héberger en tant qu'API et l'appeler depuis vos propres services, scripts ou CI — en dehors d'osFoundry.
Exécutez GLM 4.7 Flash vous-même
GLM 4.7 Flash est également disponible en open weights — hébergez-le vous-même pour un contrôle total des données et zéro coût au token. Consultez cette page pour les prérequis GPU et une comparaison des coûts avec la tarification API.
GLM 4.7 Flash face aux modèles similaires
| Modèle | Organisation | Paramètres | Contexte | Prix en entrée | Auto-hébergement |
|---|
| GLM 4.7 Flash | Z.ai | — | 203K | $ 0.060 /1M | API uniquement |
| LFM2.5-1.2B-Instruct (free) | LiquidAI | — | 33K | Free | API uniquement |
| MiniMax M2.1 | MiniMax | — | 197K | $ 0.290 /1M | API uniquement |
| Palmyra X5 | Writer | — | 1040K | $ 0.600 /1M | API uniquement |
Licence
Hosted — usage subject to provider terms — Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur.
Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Questions fréquentes sur GLM 4.7 Flash
Combien coûte GLM 4.7 Flash ?
GLM 4.7 Flash est facturé à $ 0.060 /1M en entrée et $ 0.400 /1M en sortie. Apportez votre propre clé API Z.ai — osFoundry répercute la tarification du fournisseur sans majoration.
Puis-je utiliser GLM 4.7 Flash à des fins commerciales ?
L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.
Quelle est la fenêtre de contexte de GLM 4.7 Flash ?
GLM 4.7 Flash prend en charge une fenêtre de contexte de 203K tokens.
Puis-je exécuter GLM 4.7 Flash localement ?
Non — GLM 4.7 Flash est uniquement hébergé et accessible via l'API Z.ai. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.
À quoi GLM 4.7 Flash excelle-t-il ?
GLM 4.7 Flash convient particulièrement bien à chat et routage à faible latence, routage et triage des requêtes, classification de texte.
Comment utiliser GLM 4.7 Flash dans osFoundry ?
Collez votre clé API Z.ai dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez GLM 4.7 Flash à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.
Publié par Z.ai le 19 janvier 2026. Source : https://openrouter.ai/z-ai/glm-4.7-flash