Name: GLM 4.7 Flash
Author: Z.ai

Question 1

Wie viel kostet GLM 4.7 Flash?

Accepted Answer

GLM 4.7 Flash wird mit $ 0.060 /1M für Input und $ 0.400 /1M für Output abgerechnet. Bringen Sie Ihren eigenen Z.ai-API-Key mit — osFoundry reicht die Provider-Preise ohne Aufschlag durch.

Question 2

Kann ich GLM 4.7 Flash kommerziell nutzen?

Accepted Answer

Kommerzielle Nutzung ist unter bestimmten Bedingungen erlaubt. Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit. Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.

Question 3

Wie groß ist das Kontextfenster von GLM 4.7 Flash?

Accepted Answer

GLM 4.7 Flash unterstützt ein Kontextfenster von 203K Token.

Question 4

Kann ich GLM 4.7 Flash lokal betreiben?

Accepted Answer

Nein — GLM 4.7 Flash ist nur gehostet verfügbar und wird über die Z.ai-API genutzt. Ein Open-Weights-Äquivalent steht zum Selbsthosten zur Verfügung — siehe den Querverweis oben.

Question 5

Worin ist GLM 4.7 Flash besonders gut?

Accepted Answer

GLM 4.7 Flash eignet sich besonders für Chat und Routing mit geringer Latenz, Anfrage-Routing und Triage, Textklassifikation.

Question 6

Wie verwende ich GLM 4.7 Flash in osFoundry?

Accepted Answer

Fügen Sie Ihren Z.ai-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie GLM 4.7 Flash im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.