GLM 4.7 Flash
Desarrollado por Z.ai, GLM 4.7 Flash es un modelo de chat con una ventana de contexto de 203K tokens. As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...
by Z.ai · ventana de contexto de 203K tokens
Ideal para
- chat y enrutamiento de baja latencia
- enrutamiento y triaje de solicitudes
- clasificación de texto
Formas de utilizar GLM 4.7 Flash en osFoundry
Conecten con su propia clave (BYOK)
Abran el diálogo de claves y peguen su clave de API de Z.ai. osFoundry detecta GLM 4.7 Flash automáticamente: asígnenlo a un rol de Maestro (router, direct, orchestrator o fallback) en la pestaña Pipeline y quedará activo en cada chat. Su clave, su cuenta de proveedor: sin recargo por tokens.
Úsenlo en una Room App
Las Room Apps declaran funciones de IA en su manifiesto y luego las invocan con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Invóquenlo desde sus propias aplicaciones
Una vez que un modelo está integrado en su workspace, pueden alojarlo como API y consumirlo desde sus propios servicios, scripts o CI, fuera de osFoundry.
Ejecuten GLM 4.7 Flash ustedes mismos
GLM 4.7 Flash también está disponible como pesos abiertos: aloja tú mismo el modelo para tener control total de los datos y sin coste por token. Consulten esa página para conocer los requisitos de GPU y una comparativa de costes frente al precio de la API.
GLM 4.7 Flash frente a modelos similares
Licencia
Hosted — usage subject to provider terms — Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor.
No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
Preguntas frecuentes sobre GLM 4.7 Flash
¿Cuánto cuesta GLM 4.7 Flash?
GLM 4.7 Flash se factura a $ 0.060 /1M por entrada y $ 0.400 /1M por salida. Aporten su propia clave de API de Z.ai: osFoundry traslada el precio del proveedor sin recargo.
¿Puedo utilizar GLM 4.7 Flash comercialmente?
El uso comercial está permitido con condiciones. Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor. No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
¿Cuál es la ventana de contexto de GLM 4.7 Flash?
GLM 4.7 Flash admite una ventana de contexto de 203K tokens.
¿Puedo ejecutar GLM 4.7 Flash localmente?
No: GLM 4.7 Flash es solo alojado y se accede a través de la API de Z.ai. Existe un equivalente de pesos abiertos para autoalojar: consulten el enlace cruzado de arriba.
¿En qué destaca GLM 4.7 Flash?
GLM 4.7 Flash es muy adecuado para chat y enrutamiento de baja latencia, enrutamiento y triaje de solicitudes, clasificación de texto.
¿Cómo se utiliza GLM 4.7 Flash en osFoundry?
Peguen su clave de API de Z.ai en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen GLM 4.7 Flash a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.
Publicado por Z.ai el 19 de enero de 2026. Fuente: https://openrouter.ai/z-ai/glm-4.7-flash