Name: Qwen 2.5 72B
Author: Alibaba

Question 1

¿Es gratuito el uso de Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B se puede ejecutar gratis localmente en su propio hardware. El acceso alojado a través de osFoundry se mide (entrada Free (local) / $ 0.50 /1M, salida Free (local) / $ 0.70 /1M). Pueden alternar entre local y alojado en cualquier momento.

Question 2

¿Puedo utilizar Qwen 2.5 72B comercialmente?

Accepted Answer

Sí, se permite el uso comercial. Permite uso comercial con atribución; ciertas restricciones sobre el uso indebido. Se requiere la atribución "Built with Qwen" en los derivados.

Question 3

¿Cuál es la ventana de contexto de Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B admite una ventana de contexto de 131K tokens.

Question 4

¿Cuánta VRAM necesita Qwen 2.5 72B?

Accepted Answer

Aproximadamente 44 GB con cuantización Q4, o 173 GB con precisión FP16 completa. Cabe en una sola A100/H100 80GB.

Question 5

¿Puedo ejecutar Qwen 2.5 72B localmente?

Accepted Answer

Sí. Qwen 2.5 72B es de pesos abiertos y se ejecuta localmente en una GPU de estación de trabajo. El runtime local de osFoundry gestiona la carga del modelo, la cuantización y el enrutamiento.

Question 6

¿En qué destaca Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B es muy adecuado para chat general y preguntas y respuestas, generación y revisión de código, razonamiento matemático.

Question 7

¿Cómo se utiliza Qwen 2.5 72B en osFoundry?

Accepted Answer

Peguen su clave de API de Alibaba en el diálogo de claves (o desplieguen los pesos abiertos para modelos autoalojables), asignen Qwen 2.5 72B a un rol de Maestro en la pestaña Pipeline y úsenlo en chat, en Room Apps mediante invokeAI o en sus propias aplicaciones.