Qwen3 Max Thinking
Lançado pela Qwen em 2026, Qwen3 Max Thinking é um modelo de chat. Qwen3-Max-Thinking is the flagship reasoning model in the Qwen3 series, designed for high-stakes cognitive tasks that require deep, multi-step reasoning. By significantly scaling model capacity and reinforcement learning compute, it...
by Qwen · janela de contexto de 262K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar Qwen3 Max Thinking no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da Qwen. O osFoundry descobre Qwen3 Max Thinking automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Qwen3 Max Thinking vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| Qwen3 Max Thinking | Qwen | — | 262K | $ 0.780 /1M | Apenas API |
| GLM 5 | Z.ai | — | 203K | $ 0.600 /1M | Apenas API |
| MiniMax M2.5 | MiniMax | — | 197K | $ 0.150 /1M | Apenas API |
| Step 3.5 Flash | StepFun | — | 262K | $ 0.100 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre Qwen3 Max Thinking
Quanto custa Qwen3 Max Thinking?
Qwen3 Max Thinking é cobrado a $ 0.780 /1M para entrada e $ 3.90 /1M para saída. Use sua própria chave de API da Qwen — o osFoundry repassa o preço do provedor sem markup.
Posso usar Qwen3 Max Thinking comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de Qwen3 Max Thinking?
Qwen3 Max Thinking suporta uma janela de contexto de 262K tokens.
Posso rodar Qwen3 Max Thinking localmente?
Não — Qwen3 Max Thinking é somente hospedado e acessado via API da Qwen.
Em que Qwen3 Max Thinking é melhor?
Qwen3 Max Thinking é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso Qwen3 Max Thinking no osFoundry?
Cole sua chave de API da Qwen no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Qwen3 Max Thinking a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela Qwen em 9 de fevereiro de 2026. Fonte: https://openrouter.ai/qwen/qwen3-max-thinking