Olmo 3 32B Think
O Olmo 3 32B Think da AllenAI é um modelo de chat. Olmo 3 32B Think is a large-scale, 32-billion-parameter model purpose-built for deep reasoning, complex logic chains and advanced instruction-following scenarios. Its capacity enables strong performance on demanding evaluation tasks and...
by AllenAI · janela de contexto de 66K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar Olmo 3 32B Think no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da AllenAI. O osFoundry descobre Olmo 3 32B Think automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute Olmo 3 32B Think por conta própria
Olmo 3 32B Think também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
Olmo 3 32B Think vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| Olmo 3 32B Think | AllenAI | — | 66K | $ 0.150 /1M | Apenas API |
| INTELLECT-3 | Prime Intellect | — | 131K | $ 0.200 /1M | Apenas API |
| Cogito v2.1 671B | Deep Cogito | — | 128K | $ 1.25 /1M | Apenas API |
| DeepSeek V3.2 | DeepSeek | — | 131K | $ 0.252 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre Olmo 3 32B Think
Quanto custa Olmo 3 32B Think?
Olmo 3 32B Think é cobrado a $ 0.150 /1M para entrada e $ 0.500 /1M para saída. Use sua própria chave de API da AllenAI — o osFoundry repassa o preço do provedor sem markup.
Posso usar Olmo 3 32B Think comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de Olmo 3 32B Think?
Olmo 3 32B Think suporta uma janela de contexto de 66K tokens.
Posso rodar Olmo 3 32B Think localmente?
Não — Olmo 3 32B Think é somente hospedado e acessado via API da AllenAI. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que Olmo 3 32B Think é melhor?
Olmo 3 32B Think é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso Olmo 3 32B Think no osFoundry?
Cole sua chave de API da AllenAI no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Olmo 3 32B Think a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela AllenAI em 21 de novembro de 2025. Fonte: https://openrouter.ai/allenai/olmo-3-32b-think