Name: Qwen 2.5 72B
Author: Alibaba

Question 1

Apakah Qwen 2.5 72B gratis untuk digunakan?

Accepted Answer

Qwen 2.5 72B gratis untuk dijalankan secara lokal pada hardware Anda sendiri. Akses ter-host melalui osFoundry dikenakan biaya (input Free (local) / $ 0.50 /1M, output Free (local) / $ 0.70 /1M). Anda dapat beralih antara lokal dan ter-host kapan saja.

Question 2

Bisakah saya menggunakan Qwen 2.5 72B secara komersial?

Accepted Answer

Ya — penggunaan komersial diizinkan. Mengizinkan penggunaan komersial dengan atribusi; ada beberapa pembatasan terhadap penyalahgunaan. Atribusi "Built with Qwen" wajib pada derivatif.

Question 3

Berapa context window dari Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B mendukung context window 131K token.

Question 4

Berapa VRAM yang dibutuhkan Qwen 2.5 72B?

Accepted Answer

Sekitar 44 GB pada kuantisasi Q4, atau 173 GB pada presisi FP16 penuh. Muat di satu A100/H100 80GB.

Question 5

Bisakah saya menjalankan Qwen 2.5 72B secara lokal?

Accepted Answer

Ya. Qwen 2.5 72B bersifat open-weights dan berjalan secara lokal di GPU workstation. Runtime lokal osFoundry menangani pemuatan model, kuantisasi, dan routing.

Question 6

Apa keunggulan utama Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B sangat cocok untuk chat umum dan tanya-jawab, pembuatan dan tinjauan kode, penalaran matematis.

Question 7

Bagaimana cara menggunakan Qwen 2.5 72B di osFoundry?

Accepted Answer

Tempelkan API key Alibaba Anda di dialog key (atau deploy open weights untuk model yang dapat di-self-host), tetapkan Qwen 2.5 72B ke peran Maestro di tab Pipeline, lalu gunakan di chat, di Room App via invokeAI, atau di aplikasi Anda sendiri.