一、准备工作:获取 NVIDIA API Key
- 打开浏览器访问 https://build.nvidia.com
- 注册/登录 NVIDIA 开发者账号(直接用 Google/Microsoft/GitHub 账号登录即可)
- 登录后进入 API Keys 页面:https://build.nvidia.com/settings/keys
- 点击 "Generate New API Key" 生成密钥
- 复制密钥(格式为
nvapi-xxxxxxxx...,妥善保存,关闭页面后不可再查看)
查询当前可用免费模型列表:
https://build.nvidia.com/models?filters=nimType%3Anim_type_preview
二、通过 /connect 命令快速配置(推荐新手)
这是最简单的方式,OpenCode 会自动帮你配置密钥和模型。
- 打开终端,进入你的工作目录,启动 OpenCode:
opencode
- 在 OpenCode 界面中,输入
/connect 命令:
/connect
- 在接下来的列表中,选择 NVIDIA(可以按
j/k 键或方向键选择,按回车确认)
- 输入你的 NVIDIA API Key:
┌ API key│
│ nvapi-你的密钥粘贴在这里
└ enter
- 输入完成后,输入
/models 查看所有可用模型:
/models
- 使用方向键选择你想要的 NVIDIA 模型(如
nemotron-3-super-120b-a12b),按回车确认
三、通过配置文件手动配置(推荐进阶用户)
如果你想固定使用某个模型,或者想同时配置多个模型,可以修改配置文件。
3.1 找到配置文件位置
- 项目级配置:
./opencode.json 或 .opencode/opencode.json(项目根目录)
- 全局配置:
~/.config/opencode/opencode.json(所有项目通用)
新手建议先创建项目级配置,在项目根目录下执行:
Windows (PowerShell):
New-Item -Path .\opencode.json -Value '{"$schema":"https://opencode.ai/config.json"}' -ItemType File
Mac/Linux:
touch opencode.json
echo '{"$schema":"https://opencode.ai/config.json"}' > opencode.json
3.2 编辑配置文件
在 opencode.json 中添加 NVIDIA 配置,推荐完整配置如下:
{
"$schema": "https://opencode.ai/config.json",
"model": "nvidia/nemotron-3-super-120b-a12b",
"provider": {
"nvidia": {
"options": {
"apiKey": "nvapi-你的API密钥粘贴在这里"
}
}
}
}
关键字段说明:
model:默认主模型,格式为 nvidia/模型ID
small_model(可选):设置小模型用于标题生成等轻量任务
{
"small_model": "nvidia/mistral-small-4-119b-2603"
}
3.3 配置自定义模型(可选)
如果你在 NVIDIA 网站上看到了 OpenCode 没有预加载的模型,可以手动添加:
{
"provider": {
"nvidia": {
"models": {
"在/model页面看到的模型ID": {
"name": "你喜欢的模型名称"
}
}
}
}
}
示例:
{
"provider": {
"nvidia": {
"models": {
"nemotron-3-ultra-550b-a55b": {
"name": "Nemotron 3 Ultra (550B)"
}
}
}
}
}
3.4 使用环境变量配置(更安全,不把 Key 写在配置文件里)
Windows (PowerShell):
$env:NVIDIA_API_KEY="nvapi-你的密钥"
opencode
Windows (CMD):
set NVIDIA_API_KEY=nvapi-你的密钥
opencode
Mac/Linux:
export NVIDIA_API_KEY="nvapi-你的密钥"
opencode
四、验证配置是否成功
- 启动 OpenCode 后,输入
/models 命令
- 查看列表里是否出现 NVIDIA 相关的模型
- 选择一个模型(如用方向键选中
nvidia/nemotron-3-super-120b-a12b)
- 尝试发送一条消息测试:
你好,请简单介绍一下你自己
如果模型正常回复,说明配置成功。
五、推荐 NVIDIA 免费模型速查表
以下是在 https://build.nvidia.com/models?filters=nimType%3Anim_type_preview 页面上标有 "Free Endpoint"(免费端点)的模型,以及它们在 OpenCode 中的使用 ID:
| OpenCode 模型 ID | 模型名称 | 大小 | 特点 |
nvidia/nemotron-3-ultra-550b-a55b | Nemotron 3 Ultra | 550B (55B active) | 最新旗舰,Agent、代码、推理 |
nvidia/nemotron-3-super-120b-a12b | Nemotron 3 Super | 120B (12B active) | 中等规模,Agent/代码/推理 |
nvidia/nemotron-3-nano-omni-30b-a3b-reasoning | Nemotron 3 Nano Omni | 30B (3B active) | 多模态,支持图片/视频/语音/文本 |
nvidia/nemotron-3-content-safety | Nemotron 3 Content Safety | - | 内容安全检测 |
nvidia/nemotron-3.5-content-safety | Nemotron 3.5 Content Safety | - | 内容安全检测(新版) |
nvidia/nemotron-voicechat | Nemotron Voicechat | - | 语音对话 |
nvidia/gliner-pii | GLiNER PII | - | 提取文本中的隐私信息 |
nvidia/deepseek-v4-flash | DeepSeek V4 Flash | 284B MoE | 1M 上下文,极速编程/Agent |
nvidia/glm-5.1 | GLM-5.1 | - | 旗舰级 GLM,Agent/代码/长推理 |
nvidia/qwen3.5-397b-a17b | Qwen 3.5 VLM | 400B (17B active) | 视觉理解,支持图片 |
nvidia/qwen3.5-122b-a10b | Qwen 3.5 | 122B (10B active) | 编程、推理、Agent |
nvidia/mistral-small-4-119b-2603 | Mistral Small 4 | 119B | 多模态输入,256k 上下文 |
nvidia/mistral-medium-3.5-128b | Mistral Medium 3.5 | 128B | 文本生成、编程、Agent |
nvidia/minimax-m2.7 | MiniMax M2.7 | 230B | 编程、推理、办公 |
nvidia/gemma-4-31b-it | Gemma 4 | 31B | 谷歌出品,代码/推理 |
nvidia/step-3.7-flash | Step 3.7 Flash | MoE | 多模态推理、Agent、编程 |
nvidia/kimi-k2.6 | Kimi K2 | 1T MoE | 长时序编程、工具调用、多模态 |
nvidia/cosmos3-nano | Cosmos 3 Nano | - | 生成物理视频(文本/图像) |
nvidia/cosmos3-nano-reasoner | Cosmos 3 Nano Reasoner | - | 视频/图像理解推理 |
注意:模型 ID 中 / 分割符前是 nvidia(OpenCode 的 provider 名称),后面部分是你在 NVIDIA build 页面看到的精确模型 slug。如果模型名包含下划线 _,在 OpenCode 中保持原样。
六、切换和选择模型
方法 1:OpenCode 内切换(运行时)
在 OpenCode 中输入:
/models
用方向键选择模型,回车确认。
方法 2:CLI 参数指定(无需改配置文件)
# 直接指定模型启动,配置文件中的 model 字段会被覆盖
opencode -m nvidia/nemotron-3-ultra-550b-a55b
七、限制和注意事项
| 项目 | 说明 |
| 费用 | Free Endpoint 模型目前免费,但有速率限制(RPM,每分钟请求数) |
| 速率限制 | 不同模型限制不同,建议编码时少量测试,正式使用时注意控制频率 |
| 上下文长度 | 各模型不同,从 8K 到 1M 不等,具体看上面表格或 NVIDIA 页面 |
| 多模态 | 带 Omni/VLM 的模型支持图片输入,基础文本模型不支持 |
| 持久性 | 通过/connect 输入的 API Key 存在 ~/.local/share/opencode/auth.json,不要泄露此文件 |
| 模型 ID 格式 | 直接使用nvidia/模型路径,无需 :free 后缀 |
八、本地部署(NIM - 无需联网)
如果你有本地 GPU 并想离线使用,可以部署 NVIDIA NIM 本地服务:
- 安装 NVIDIA NIM:参考 https://docs.nvidia.com/nim/
- 配置 OpenCode(在
opencode.json 中):
{
"provider": {
"nvidia": {
"options": {
"baseURL": "http://localhost:8000/v1"
}
}
}
}
- 启动本地 NIM 服务后,像平时一样在 OpenCode 中选择 NVIDIA 模型即可。
九、同时使用多个 NVIDIA 模型
如果你需要不同的 Agent 使用不同的 NVIDIA 模型,可以这样配置:
{
"agent": {
"coder": {
"model": "nvidia/deepseek-v4-flash",
"mode": "subagent",
"description": "编程专用 Agent",
"permission": {
"edit": "allow",
"bash": "allow"
}
},
"planner": {
"model": "nvidia/nemotron-3-ultra-550b-a55b",
"mode": "subagent",
"description": "规划专用 Agent",
"permission": {
"edit": "ask",
"bash": "ask"
}
}
},
"model": "nvidia/nemotron-3-super-120b-a12b"
}
这样:
- 主会话使用
nemotron-3-super-120b-a12b
- 刷
@coder 时使用 deepseek-v4-flash
- 刷
@planner 时使用 nemotron-3-ultra-550b-a55b
十、常见问题排查
Q: 提示 Provider not found: nvidia
- 解决:确保
opencode.json 顶部的 "$schema" 字段存在且格式正确;重启 OpenCode(配置热加载有限制,建议退出重建)
Q: 输入 /models 没有 NVIDIA 模型
- 解决:确认 API Key 已正确输入;重启 OpenCode;检查网络是否能访问
integrate.api.nvidia.com
Q: 模型返回错误响应
- 解决:检查是否选中的是 NVIDIA 页面上仍标有 "Free Endpoint" 的模型;部分模型可能已转为付费
Q: 如何查看当前已用 token 数量?
- 在 OpenCode 中模型回复时,底部一般会显示
Input: XXX tokens, Output: YYY tokens
Q: 配置文件写错了导致 OpenCode 无法启动?
- 解决:删除有问题的
opencode.json 文件重新来;或设置环境变量 OPENCODE_DISABLE_PROJECT_CONFIG=1 来跳过项目配置启动
参考链接