Qwen3 30B A3B Thinking 2507
Qwen3 30B A3B Thinking 2507 é um modelo de chat da Qwen, lançado em 28 de agosto de 2025. Qwen3-30B-A3B-Thinking-2507 is a 30B parameter Mixture-of-Experts reasoning model optimized for complex tasks requiring extended multi-step thinking. The model is designed specifically for “thinking mode,” where internal reasoning traces are separated...
by Qwen · janela de contexto de 131K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar Qwen3 30B A3B Thinking 2507 no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da Qwen. O osFoundry descobre Qwen3 30B A3B Thinking 2507 automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute Qwen3 30B A3B Thinking 2507 por conta própria
Qwen3 30B A3B Thinking 2507 também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
Qwen3 30B A3B Thinking 2507 vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| Qwen3 30B A3B Thinking 2507 | Qwen | — | 131K | $ 0.080 /1M | Apenas API |
| Kimi K2 0905 | MoonshotAI | — | 262K | $ 0.600 /1M | Apenas API |
| Grok Code Fast 1 | xAI | — | 256K | $ 0.200 /1M | Apenas API |
| Nemotron Nano 9B V2 | NVIDIA | — | 131K | $ 0.040 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre Qwen3 30B A3B Thinking 2507
Quanto custa Qwen3 30B A3B Thinking 2507?
Qwen3 30B A3B Thinking 2507 é cobrado a $ 0.080 /1M para entrada e $ 0.400 /1M para saída. Use sua própria chave de API da Qwen — o osFoundry repassa o preço do provedor sem markup.
Posso usar Qwen3 30B A3B Thinking 2507 comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de Qwen3 30B A3B Thinking 2507?
Qwen3 30B A3B Thinking 2507 suporta uma janela de contexto de 131K tokens.
Posso rodar Qwen3 30B A3B Thinking 2507 localmente?
Não — Qwen3 30B A3B Thinking 2507 é somente hospedado e acessado via API da Qwen. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que Qwen3 30B A3B Thinking 2507 é melhor?
Qwen3 30B A3B Thinking 2507 é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso Qwen3 30B A3B Thinking 2507 no osFoundry?
Cole sua chave de API da Qwen no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Qwen3 30B A3B Thinking 2507 a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela Qwen em 28 de agosto de 2025. Fonte: https://openrouter.ai/qwen/qwen3-30b-a3b-thinking-2507