Name: Qwen 2.5 72B
Author: Alibaba

Question 1

Qwen 2.5 72B è gratuito?

Accepted Answer

Qwen 2.5 72B è gratuito da eseguire localmente sul suo hardware. L'accesso in hosting tramite osFoundry è a consumo (input Free (local) / $ 0.50 /1M, output Free (local) / $ 0.70 /1M). Può passare tra esecuzione locale e in hosting in qualsiasi momento.

Question 2

Posso usare Qwen 2.5 72B a scopo commerciale?

Accepted Answer

Sì — l'uso commerciale è consentito. Consente l'uso commerciale con attribuzione; alcune restrizioni sull'uso improprio. Attribuzione "Built with Qwen" richiesta nei derivati.

Question 3

Qual è la finestra di contesto di Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B supporta una finestra di contesto da 131K token.

Question 4

Quanta VRAM richiede Qwen 2.5 72B?

Accepted Answer

Circa 44 GB con quantizzazione Q4, o 173 GB in piena precisione FP16. Entra in una singola A100/H100 da 80GB.

Question 5

Posso eseguire Qwen 2.5 72B localmente?

Accepted Answer

Sì. Qwen 2.5 72B è open-weights e si esegue localmente su una GPU da workstation. Il runtime locale di osFoundry gestisce il caricamento del modello, la quantizzazione e il routing.

Question 6

In che cosa eccelle Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B è particolarmente adatto a chat generica e domande/risposte, generazione e revisione del codice, ragionamento matematico.

Question 7

Come utilizzo Qwen 2.5 72B in osFoundry?

Accepted Answer

Incolli la sua API key Alibaba nella finestra delle chiavi (oppure distribuisca i pesi aperti per i modelli auto-ospitabili), assegni Qwen 2.5 72B a un ruolo Maestro nella scheda Pipeline, quindi lo utilizzi in chat, nelle Room App tramite invokeAI o nelle sue applicazioni.