Qwen2.5 Coder 32B Instruct
Qwen2.5 Coder 32B Instruct es un modelo de chat de qwen, publicado el 11 de noviembre de 2024. Qwen2.5-Coder is the latest series of Code-Specific Qwen large language models (formerly known as CodeQwen). Qwen2.5-Coder brings the following improvements upon CodeQwen1.5: - Significantly improvements in **code generation**, **code reasoning**...
by qwen · ventana de contexto de 33K tokens
Ideal para
- chat y enrutamiento de baja latencia
- enrutamiento y triaje de solicitudes
- clasificación de texto
Formas de utilizar Qwen2.5 Coder 32B Instruct en osFoundry
Conecten con su propia clave (BYOK)
Abran el diálogo de claves y peguen su clave de API de qwen. osFoundry detecta Qwen2.5 Coder 32B Instruct automáticamente: asígnenlo a un rol de Maestro (router, direct, orchestrator o fallback) en la pestaña Pipeline y quedará activo en cada chat. Su clave, su cuenta de proveedor: sin recargo por tokens.
Úsenlo en una Room App
Las Room Apps declaran funciones de IA en su manifiesto y luego las invocan con invokeAI:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
Invóquenlo desde sus propias aplicaciones
Una vez que un modelo está integrado en su workspace, pueden alojarlo como API y consumirlo desde sus propios servicios, scripts o CI, fuera de osFoundry.
Ejecuten Qwen2.5 Coder 32B Instruct ustedes mismos
Qwen2.5 Coder 32B Instruct también está disponible como pesos abiertos: aloja tú mismo el modelo para tener control total de los datos y sin coste por token. Consulten esa página para conocer los requisitos de GPU y una comparativa de costes frente al precio de la API.
Qwen2.5 Coder 32B Instruct frente a modelos similares
| Modelo | Organización | Parámetros | Contexto | Precio de entrada | Autoalojamiento |
|---|
| Qwen2.5 Coder 32B Instruct | qwen | — | 33K | $ 0.660 /1M | Solo API |
| Mistral Large 2407 | mistralai | — | 131K | $ 2.00 /1M | Solo API |
| UnslopNemo 12B | TheDrummer | — | 33K | $ 0.400 /1M | Solo API |
| Magnum v4 72B | anthracite-org | — | 16K | $ 3.00 /1M | Solo API |
Licencia
Hosted — usage subject to provider terms — Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor.
No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
Preguntas frecuentes sobre Qwen2.5 Coder 32B Instruct
¿Cuánto cuesta Qwen2.5 Coder 32B Instruct?
Qwen2.5 Coder 32B Instruct se factura a $ 0.660 /1M por entrada y $ 1.00 /1M por salida. Aporten su propia clave de API de qwen: osFoundry traslada el precio del proveedor sin recargo.
¿Puedo utilizar Qwen2.5 Coder 32B Instruct comercialmente?
El uso comercial está permitido con condiciones. Modelo solo alojado: el uso se rige por los términos de API del proveedor. Aporten su propia clave del proveedor. No se distribuyen los pesos; el uso está sujeto a los términos del proveedor.
¿Cuál es la ventana de contexto de Qwen2.5 Coder 32B Instruct?
Qwen2.5 Coder 32B Instruct admite una ventana de contexto de 33K tokens.
¿Puedo ejecutar Qwen2.5 Coder 32B Instruct localmente?
No: Qwen2.5 Coder 32B Instruct es solo alojado y se accede a través de la API de qwen. Existe un equivalente de pesos abiertos para autoalojar: consulten el enlace cruzado de arriba.
¿En qué destaca Qwen2.5 Coder 32B Instruct?
Qwen2.5 Coder 32B Instruct es muy adecuado para chat y enrutamiento de baja latencia, enrutamiento y triaje de solicitudes, clasificación de texto.
¿Cómo se utiliza Qwen2.5 Coder 32B Instruct en osFoundry?
Peguen su clave de API de qwen en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen Qwen2.5 Coder 32B Instruct a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.
Publicado por qwen el 11 de noviembre de 2024. Fuente: https://openrouter.ai/qwen/qwen-2.5-coder-32b-instruct