Hermes 2 Pro - Llama-3 8B
Desenvolvido pela NousResearch, Hermes 2 Pro - Llama-3 8B é um modelo de chat com janela de contexto de 8K tokens. Hermes 2 Pro is an upgraded, retrained version of Nous Hermes 2, consisting of an updated and cleaned version of the OpenHermes 2.5 Dataset, as well as a newly introduced...
by NousResearch · janela de contexto de 8K tokens
Ideal para
- chat e roteamento de baixa latência
- roteamento e triagem de requisições
- classificação de texto
Como usar Hermes 2 Pro - Llama-3 8B no osFoundry
Conecte com sua própria chave (BYOK)
Abra o diálogo de chaves e cole sua chave de API da NousResearch. O osFoundry descobre Hermes 2 Pro - Llama-3 8B automaticamente — atribua-o a um papel do Maestro (router, direct, orchestrator ou fallback) na aba Pipeline e ele estará ativo em cada chat. Sua chave, sua conta no provedor — sem markup sobre tokens.
Use em um Room App
Os Room Apps declaram recursos de IA em seus manifestos e os chamam com invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Chame a partir dos seus próprios apps
Uma vez que um modelo está conectado ao seu workspace, você pode hospedá-lo como uma API e acessá-lo a partir dos seus próprios serviços, scripts ou CI — fora do osFoundry.
Execute Hermes 2 Pro - Llama-3 8B por conta própria
Hermes 2 Pro - Llama-3 8B também está disponível como open weights — auto-hospede para controle total dos dados e sem custo por token. Veja essa página para requisitos de GPU e uma comparação de custos com o preço da API.
Hermes 2 Pro - Llama-3 8B vs modelos semelhantes
Licença
Hosted — usage subject to provider terms — Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor.
Sem distribuição de pesos; uso sujeito aos termos do provedor.
Perguntas frequentes sobre Hermes 2 Pro - Llama-3 8B
Quanto custa Hermes 2 Pro - Llama-3 8B?
Hermes 2 Pro - Llama-3 8B é cobrado a $ 0.140 /1M para entrada e $ 0.140 /1M para saída. Use sua própria chave de API da NousResearch — o osFoundry repassa o preço do provedor sem markup.
Posso usar Hermes 2 Pro - Llama-3 8B comercialmente?
Uso comercial é permitido com condições. Modelo apenas hospedado — uso regido pelos termos de API do provedor. Use sua própria chave de provedor. Sem distribuição de pesos; uso sujeito aos termos do provedor.
Qual é a janela de contexto de Hermes 2 Pro - Llama-3 8B?
Hermes 2 Pro - Llama-3 8B suporta uma janela de contexto de 8K tokens.
Posso rodar Hermes 2 Pro - Llama-3 8B localmente?
Não — Hermes 2 Pro - Llama-3 8B é somente hospedado e acessado via API da NousResearch. Há um equivalente open-weights disponível para auto-hospedagem — veja o link cruzado acima.
Em que Hermes 2 Pro - Llama-3 8B é melhor?
Hermes 2 Pro - Llama-3 8B é bem adequado para chat e roteamento de baixa latência, roteamento e triagem de requisições, classificação de texto.
Como uso Hermes 2 Pro - Llama-3 8B no osFoundry?
Cole sua chave de API da NousResearch no diálogo de chaves (ou implante os pesos abertos para modelos auto-hospedáveis), atribua Hermes 2 Pro - Llama-3 8B a um papel do Maestro na aba Pipeline e use-o em chats, em Room Apps via invokeAI ou nos seus próprios apps.
Publicado pela NousResearch em 27 de maio de 2024. Fonte: https://openrouter.ai/nousresearch/hermes-2-pro-llama-3-8b