Hermes 4 405B
O Hermes 4 405B da Nous é um modelo de chat. Hermes 4 is a large-scale reasoning model built on Meta-Llama-3.1-405B and released by Nous Research. It introduces a hybrid reasoning mode, where the model can choose to deliberate internally with...
by Nous · janela de contexto de 131K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar Hermes 4 405B no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da Nous. O osFoundry descobre Hermes 4 405B automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute Hermes 4 405B por conta própria
Hermes 4 405B também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
Hermes 4 405B vs modelos semelhantes
| Modelo | Organização | Parâmetros | Contexto | Preço de entrada | Auto-hospedado |
|---|
| Hermes 4 405B | Nous | — | 131K | $ 1.00 /1M | Apenas API |
| DeepSeek V3.1 | DeepSeek | — | 164K | $ 0.210 /1M | Apenas API |
| Grok Code Fast 1 | xAI | — | 256K | $ 0.200 /1M | Apenas API |
| ERNIE 4.5 21B A3B | Baidu | — | 120K | $ 0.070 /1M | Apenas API |
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre Hermes 4 405B
Quanto custa Hermes 4 405B?
Hermes 4 405B é cobrado a $ 1.00 /1M para entrada e $ 3.00 /1M para saída. Use sua própria chave de API da Nous — o osFoundry repassa o preço do provedor sem markup.
Posso usar Hermes 4 405B comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de Hermes 4 405B?
Hermes 4 405B suporta uma janela de contexto de 131K tokens.
Posso rodar Hermes 4 405B localmente?
Não — Hermes 4 405B é somente hospedado e acessado via API da Nous. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que Hermes 4 405B é melhor?
Hermes 4 405B é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso Hermes 4 405B no osFoundry?
Cole sua chave de API da Nous no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Hermes 4 405B a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela Nous em 26 de agosto de 2025. Fonte: https://openrouter.ai/nousresearch/hermes-4-405b