Name: GLM 4.7 Flash
Author: Z.ai

Question 1

Combien coûte GLM 4.7 Flash ?

Accepted Answer

GLM 4.7 Flash est facturé à $ 0.060 /1M en entrée et $ 0.400 /1M en sortie. Apportez votre propre clé API Z.ai — osFoundry répercute la tarification du fournisseur sans majoration.

Question 2

Puis-je utiliser GLM 4.7 Flash à des fins commerciales ?

Accepted Answer

L'usage commercial est autorisé sous conditions. Modèle hébergé uniquement — l'utilisation est régie par les conditions d'API du fournisseur. Apportez votre propre clé fournisseur. Aucun poids distribué ; usage soumis aux conditions du fournisseur.

Question 3

Quelle est la fenêtre de contexte de GLM 4.7 Flash ?

Accepted Answer

GLM 4.7 Flash prend en charge une fenêtre de contexte de 203K tokens.

Question 4

Puis-je exécuter GLM 4.7 Flash localement ?

Accepted Answer

Non — GLM 4.7 Flash est uniquement hébergé et accessible via l'API Z.ai. Un équivalent en open-weights est disponible en auto-hébergement — voir le lien croisé ci-dessus.

Question 5

À quoi GLM 4.7 Flash excelle-t-il ?

Accepted Answer

GLM 4.7 Flash convient particulièrement bien à chat et routage à faible latence, routage et triage des requêtes, classification de texte.

Question 6

Comment utiliser GLM 4.7 Flash dans osFoundry ?

Accepted Answer

Collez votre clé API Z.ai dans la fenêtre de clés (ou déployez les open weights pour les modèles auto-hébergeables), assignez GLM 4.7 Flash à un rôle Maestro dans l'onglet Pipeline, puis utilisez-le en chat, dans les Room Apps via invokeAI, ou dans vos propres applications.