Name: Llama 3.3 70B
Author: Meta

Question 1

Llama 3.3 70B 可以免费使用吗？

Accepted Answer

Llama 3.3 70B 在您自己的硬件上本地运行时可免费使用。通过 osFoundry 的托管访问按用量计费（输入 Free (local) / $ 0.59 /1M，输出 Free (local) / $ 0.79 /1M）。您可随时在本地与托管方式之间切换。

Question 2

我可以将 Llama 3.3 70B 用于商业用途吗？

Accepted Answer

允许有条件的商业使用。 允许商业使用，月活跃用户不超过 7 亿；规模更大的部署需要单独许可。 需要 "Built with Llama" 署名。

Question 3

Llama 3.3 70B 的上下文窗口有多大？

Accepted Answer

Llama 3.3 70B 支持 128K token 的上下文窗口。

Question 4

Llama 3.3 70B 需要多少 VRAM？

Accepted Answer

Q4 量化下约 42 GB，FP16 全精度下约 168 GB。可在单张 A100/H100 80GB 上运行。

Question 5

我可以在本地运行 Llama 3.3 70B 吗？

Accepted Answer

可以。Llama 3.3 70B 为开源权重模型，可在工作站 GPU 上本地运行。osFoundry 的本地运行时负责模型加载、量化与路由。

Question 6

Llama 3.3 70B 最擅长什么？

Accepted Answer

Llama 3.3 70B 非常适合通用对话与问答, 智能体编排与工具调用, 长文档分析与摘要。

Question 7

如何在 osFoundry 中使用 Llama 3.3 70B？

Accepted Answer

在密钥对话框中粘贴您的 Meta API 密钥（若为可自托管的开源权重模型，则部署其权重），在 Pipeline 标签中将 Llama 3.3 70B 分配给某个 Maestro 角色，然后即可在对话、通过 invokeAI 的 Room App 或您自己的应用中使用。