GLM 4 32B
GLM 4 32B (Z.ai, 2025) es un modelo de chat. GLM 4 32B is a cost-effective foundation language model. It can efficiently perform complex tasks and has significantly enhanced capabilities in tool use, online search, and code-related intelligent tasks. It...
by Z.ai · ventana de contexto de 128K tokens
Ideal para
- chat y enrutamiento de baja latencia
- enrutamiento y triaje de solicitudes
- clasificación de texto
Formas de utilizar GLM 4 32B en osFoundry
Conecten con su propia clave (BYOK)
Abran el diálogo de claves y peguen su clave de API de Z.ai. osFoundry detecta GLM 4 32B automáticamente: asígnenlo a un rol de Maestro (router, direct, orchestrator o fallback) en la pestaña Pipeline y quedará activo en cada chat. Su clave, su cuenta de proveedor: sin recargo por tokens.
Úsenlo en una Room App
Las Room Apps declaran funciones de IA en su manifiesto y luego las invocan con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Invóquenlo desde sus propias aplicaciones
Una vez que un modelo está integrado en su workspace, pueden alojarlo como API y consumirlo desde sus propios servicios, scripts o CI, fuera de osFoundry.
GLM 4 32B frente a modelos similares
Licencia
Hosted — usage subject to provider terms — Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor.
No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
Preguntas frecuentes sobre GLM 4 32B
¿Cuánto cuesta GLM 4 32B ?
GLM 4 32B se factura a $ 0.100 /1M por entrada y $ 0.100 /1M por salida. Aporten su propia clave de API de Z.ai: osFoundry traslada el precio del proveedor sin recargo.
¿Puedo utilizar GLM 4 32B comercialmente?
El uso comercial está permitido con condiciones. Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor. No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
¿Cuál es la ventana de contexto de GLM 4 32B ?
GLM 4 32B admite una ventana de contexto de 128K tokens.
¿Puedo ejecutar GLM 4 32B localmente?
No: GLM 4 32B es solo alojado y se accede a través de la API de Z.ai.
¿En qué destaca GLM 4 32B ?
GLM 4 32B es muy adecuado para chat y enrutamiento de baja latencia, enrutamiento y triaje de solicitudes, clasificación de texto.
¿Cómo se utiliza GLM 4 32B en osFoundry?
Peguen su clave de API de Z.ai en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen GLM 4 32B a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.
Publicado por Z.ai el 24 de julio de 2025. Fuente: https://openrouter.ai/z-ai/glm-4-32b