Qwen3 Max Thinking
Lanzado por Qwen en 2026, Qwen3 Max Thinking es un modelo de chat. Qwen3-Max-Thinking is the flagship reasoning model in the Qwen3 series, designed for high-stakes cognitive tasks that require deep, multi-step reasoning. By significantly scaling model capacity and reinforcement learning compute, it...
by Qwen · ventana de contexto de 262K tokens
Ideal para
- chat y enrutamiento de baja latencia
- enrutamiento y triaje de solicitudes
- clasificación de texto
Formas de utilizar Qwen3 Max Thinking en osFoundry
Conecten con su propia clave (BYOK)
Abran el diálogo de claves y peguen su clave de API de Qwen. osFoundry detecta Qwen3 Max Thinking automáticamente: asígnenlo a un rol de Maestro (router, direct, orchestrator o fallback) en la pestaña Pipeline y quedará activo en cada chat. Su clave, su cuenta de proveedor: sin recargo por tokens.
Úsenlo en una Room App
Las Room Apps declaran funciones de IA en su manifiesto y luego las invocan con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Invóquenlo desde sus propias aplicaciones
Una vez que un modelo está integrado en su workspace, pueden alojarlo como API y consumirlo desde sus propios servicios, scripts o CI, fuera de osFoundry.
Qwen3 Max Thinking frente a modelos similares
| Modelo | Organización | Parámetros | Contexto | Precio de entrada | Autoalojamiento |
|---|
| Qwen3 Max Thinking | Qwen | — | 262K | $ 0.780 /1M | Solo API |
| GLM 5 | Z.ai | — | 203K | $ 0.600 /1M | Solo API |
| MiniMax M2.5 | MiniMax | — | 197K | $ 0.150 /1M | Solo API |
| Step 3.5 Flash | StepFun | — | 262K | $ 0.100 /1M | Solo API |
Licencia
Hosted — usage subject to provider terms — Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor.
No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
Preguntas frecuentes sobre Qwen3 Max Thinking
¿Cuánto cuesta Qwen3 Max Thinking?
Qwen3 Max Thinking se factura a $ 0.780 /1M por entrada y $ 3.90 /1M por salida. Aporten su propia clave de API de Qwen: osFoundry traslada el precio del proveedor sin recargo.
¿Puedo utilizar Qwen3 Max Thinking comercialmente?
El uso comercial está permitido con condiciones. Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor. No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
¿Cuál es la ventana de contexto de Qwen3 Max Thinking?
Qwen3 Max Thinking admite una ventana de contexto de 262K tokens.
¿Puedo ejecutar Qwen3 Max Thinking localmente?
No: Qwen3 Max Thinking es solo alojado y se accede a través de la API de Qwen.
¿En qué destaca Qwen3 Max Thinking?
Qwen3 Max Thinking es muy adecuado para chat y enrutamiento de baja latencia, enrutamiento y triaje de solicitudes, clasificación de texto.
¿Cómo se utiliza Qwen3 Max Thinking en osFoundry?
Peguen su clave de API de Qwen en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen Qwen3 Max Thinking a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.
Publicado por Qwen el 9 de febrero de 2026. Fuente: https://openrouter.ai/qwen/qwen3-max-thinking