Name: Qwen 2.5 72B
Author: Alibaba

Question 1

Qwen 2.5 72B 可以免费使用吗？

Accepted Answer

Qwen 2.5 72B 在您自己的硬件上本地运行时可免费使用。通过 osFoundry 的托管访问按用量计费（输入 Free (local) / $ 0.50 /1M，输出 Free (local) / $ 0.70 /1M）。您可随时在本地与托管方式之间切换。

Question 2

我可以将 Qwen 2.5 72B 用于商业用途吗？

Accepted Answer

可以——允许商业使用。 允许在署名前提下商业使用；对滥用有一定限制。 衍生作品中需要 "Built with Qwen" 署名。

Question 3

Qwen 2.5 72B 的上下文窗口有多大？

Accepted Answer

Qwen 2.5 72B 支持 131K token 的上下文窗口。

Question 4

Qwen 2.5 72B 需要多少 VRAM？

Accepted Answer

Q4 量化下约 44 GB，FP16 全精度下约 173 GB。可在单张 A100/H100 80GB 上运行。

Question 5

我可以在本地运行 Qwen 2.5 72B 吗？

Accepted Answer

可以。Qwen 2.5 72B 为开源权重模型，可在工作站 GPU 上本地运行。osFoundry 的本地运行时负责模型加载、量化与路由。

Question 6

Qwen 2.5 72B 最擅长什么？

Accepted Answer

Qwen 2.5 72B 非常适合通用对话与问答, 代码生成与审查, 数学推理。

Question 7

如何在 osFoundry 中使用 Qwen 2.5 72B？

Accepted Answer

在密钥对话框中粘贴您的 Alibaba API 密钥（若为可自托管的开源权重模型，则部署其权重），在 Pipeline 标签中将 Qwen 2.5 72B 分配给某个 Maestro 角色，然后即可在对话、通过 invokeAI 的 Room App 或您自己的应用中使用。