Name: Qwen 2.5 72B
Author: Alibaba

Question 1

Ist Qwen 2.5 72B kostenlos nutzbar?

Accepted Answer

Qwen 2.5 72B kann auf Ihrer eigenen Hardware kostenlos lokal betrieben werden. Der gehostete Zugriff über osFoundry wird abgerechnet (Input Free (local) / $ 0.50 /1M, Output Free (local) / $ 0.70 /1M). Sie können jederzeit zwischen lokal und gehostet wechseln.

Question 2

Kann ich Qwen 2.5 72B kommerziell nutzen?

Accepted Answer

Ja — kommerzielle Nutzung ist erlaubt. Erlaubt kommerzielle Nutzung mit Attribution; einige Einschränkungen bei Missbrauch. "Built with Qwen"-Attribution in Derivaten erforderlich.

Question 3

Wie groß ist das Kontextfenster von Qwen 2.5 72B?

Accepted Answer

Qwen 2.5 72B unterstützt ein Kontextfenster von 131K Token.

Question 4

Wie viel VRAM benötigt Qwen 2.5 72B?

Accepted Answer

Etwa 44 GB bei Q4-Quantization oder 173 GB bei voller FP16-Präzision. Passt auf eine einzelne A100/H100 80GB.

Question 5

Kann ich Qwen 2.5 72B lokal betreiben?

Accepted Answer

Ja. Qwen 2.5 72B ist Open-Weights und läuft lokal auf einer Workstation-GPU. Die lokale Runtime von osFoundry übernimmt Modellladen, Quantization und Routing.

Question 6

Worin ist Qwen 2.5 72B besonders gut?

Accepted Answer

Qwen 2.5 72B eignet sich besonders für allgemeiner Chat und Q&A, Codegenerierung und Code-Review, mathematisches Reasoning.

Question 7

Wie verwende ich Qwen 2.5 72B in osFoundry?

Accepted Answer

Fügen Sie Ihren Alibaba-API-Key im Schlüssel-Dialog ein (oder stellen Sie bei selbst hostbaren Modellen die Open Weights bereit), weisen Sie Qwen 2.5 72B im Pipeline-Tab einer Maestro-Rolle zu und nutzen Sie es anschließend im Chat, in Room Apps über invokeAI oder in Ihren eigenen Anwendungen.