Granite 4.1 8B
Granite 4.1 8B 是来自 IBM 的对话模型,发布于 2026年4月30日。Granite 4.1 8B is a dense, decoder-only 8-billion-parameter language model from IBM, part of the Granite 4.1 family. It supports a 131K-token context window and is designed for enterprise tasks...
by IBM · 131K token 上下文窗口
最佳适用场景
在 osFoundry 中使用 Granite 4.1 8B 的方式
使用您自己的密钥接入(BYOK)
打开密钥对话框并粘贴您的 IBM API 密钥。osFoundry 会自动发现 Granite 4.1 8B——在 Pipeline 标签中将其分配给 Maestro 角色(router、direct、orchestrator 或 fallback),即可在每次对话中启用。您的密钥、您的服务商账户——零 token 加价。
在 Room App 中使用
Room App 在 manifest 中声明 AI 功能,然后通过 invokeAI 调用:
import { invokeAI } from '@osfoundry/app-sdk'
// 'summarize' is an AI feature declared in your app manifest.
const result = await invokeAI('summarize', userText)
从您自己的应用中调用
模型接入工作区后,您可将其托管为 API,并从您自己的服务、脚本或 CI 中(osFoundry 之外)访问。
自行运行 Granite 4.1 8B
Granite 4.1 8B 也以开源权重形式提供——自行托管,实现完全的数据自主并免除按 token 计费的成本。请查阅该页面了解 GPU 需求以及与 API 定价的成本对比。
Granite 4.1 8B 与同类模型对比
许可证
Hosted — usage subject to provider terms — 仅托管模型——使用受服务商 API 条款约束。请使用您自己的服务商密钥。
不分发权重;使用受服务商条款约束。
关于 Granite 4.1 8B 的常见问题
Granite 4.1 8B 的费用是多少?
Granite 4.1 8B 按输入 $ 0.050 /1M、输出 $ 0.100 /1M计费。使用您自己的 IBM API 密钥——osFoundry 透传服务商定价,不加价。
我可以将 Granite 4.1 8B 用于商业用途吗?
允许有条件的商业使用。 仅托管模型——使用受服务商 API 条款约束。请使用您自己的服务商密钥。 不分发权重;使用受服务商条款约束。
Granite 4.1 8B 的上下文窗口有多大?
Granite 4.1 8B 支持 131K token 的上下文窗口。
我可以在本地运行 Granite 4.1 8B 吗?
不可以——Granite 4.1 8B 仅以托管方式提供,通过 IBM API 访问。 存在可自行托管的开源权重等效模型——请参见上方的交叉链接。
Granite 4.1 8B 最擅长什么?
Granite 4.1 8B 非常适合低延迟对话与路由, 请求路由与分诊, 文本分类。
如何在 osFoundry 中使用 Granite 4.1 8B?
在密钥对话框中粘贴您的 IBM API 密钥(若为可自托管的开源权重模型,则部署其权重),在 Pipeline 标签中将 Granite 4.1 8B 分配给某个 Maestro 角色,然后即可在对话、通过 invokeAI 的 Room App 或您自己的应用中使用。
由 IBM 发布,发布日期 2026年4月30日。 来源:https://openrouter.ai/ibm-granite/granite-4.1-8b