GLM 4.7 Flash
Entwickelt von Z.ai, ist GLM 4.7 Flash ein Chat-Modell mit einem Kontextfenster von 203K Token. As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...
by Z.ai · Kontextfenster von 203K Token
Am besten geeignet für
- Chat und Routing mit geringer Latenz
- Anfrage-Routing und Triage
- Textklassifikation
Möglichkeiten, GLM 4.7 Flash in osFoundry zu nutzen
Mit eigenem Schlüssel verbinden (BYOK)
Öffnen Sie den Schlüssel-Dialog und fügen Sie Ihren Z.ai-API-Key ein. osFoundry erkennt GLM 4.7 Flash automatisch — weisen Sie es im Pipeline-Tab einer Maestro-Rolle (Router, Direct, Orchestrator oder Fallback) zu, und es ist in jedem Chat verfügbar. Ihr Key, Ihr Provider-Konto — kein Token-Aufschlag.
In einer Room App verwenden
Room Apps deklarieren KI-Funktionen in ihrem Manifest und rufen sie anschließend mit invokeAI auf:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Aus eigenen Anwendungen aufrufen
Sobald ein Modell in Ihrem Workspace eingerichtet ist, können Sie es als API hosten und aus Ihren eigenen Diensten, Skripten oder CI — außerhalb von osFoundry — erreichen.
GLM 4.7 Flash selbst betreiben
GLM 4.7 Flash ist auch als Open Weights verfügbar — selbst hosten für volle Datenkontrolle und ohne Kosten pro Token. Auf jener Seite finden Sie GPU-Anforderungen und einen Kostenvergleich mit API-Preisen.
GLM 4.7 Flash im Vergleich zu ähnlichen Modellen
Lizenz
Hosted — usage subject to provider terms — Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit.
Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Häufige Fragen zu GLM 4.7 Flash
Wie viel kostet GLM 4.7 Flash?
GLM 4.7 Flash wird mit $ 0.060 /1M für Input und $ 0.400 /1M für Output abgerechnet. Bringen Sie Ihren eigenen Z.ai-API-Key mit — osFoundry reicht die Provider-Preise ohne Aufschlag durch.
Kann ich GLM 4.7 Flash kommerziell nutzen?
Kommerzielle Nutzung ist unter bestimmten Bedingungen erlaubt. Nur gehostetes Modell — die Nutzung unterliegt den API-Bedingungen des Anbieters. Bringen Sie Ihren eigenen Provider-Key mit. Keine Weights verteilt; Nutzung unterliegt den Anbieterbedingungen.
Wie groß ist das Kontextfenster von GLM 4.7 Flash?
GLM 4.7 Flash unterstützt ein Kontextfenster von 203K Token.
Kann ich GLM 4.7 Flash lokal betreiben?
Nein — GLM 4.7 Flash ist nur gehostet verfügbar und wird über die Z.ai-API genutzt. Ein Open-Weights-Äquivalent steht zum Selbsthosten zur Verfügung — siehe den Querverweis oben.
Worin ist GLM 4.7 Flash besonders gut?
GLM 4.7 Flash eignet sich besonders für Chat und Routing mit geringer Latenz, Anfrage-Routing und Triage, Textklassifikation.
Wie verwende ich GLM 4.7 Flash in osFoundry?
Fügen Sie Ihren Z.ai-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie GLM 4.7 Flash im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.
Veröffentlicht von Z.ai am 19. Januar 2026. Quelle: https://openrouter.ai/z-ai/glm-4.7-flash