Ollama:NVIDIA Nemotron 3 Nano 4B 模型上线
Ollama 宣布 NVIDIA Nemotron 3 Nano 4B 模型现已可通过 Ollama 运行。该模型是 Nemotron 家族新成员,专为资源受限硬件上的 Agent 构建与运行场景设计,可与 Pi 轻量级 Agent 运行时配合使用。
查看原文Ollama 上线 NVIDIA Nemotron 3 Nano 4B,专为「受限硬件 + Agent 场景」优化,是边缘侧本地 Agent 部署的新选择——但 4B 规模的能力上限需实际验证。
产品是什么
NVIDIA Nemotron 3 Nano 4B 是 NVIDIA Nemotron 家族的最新轻量成员,参数规模 40 亿(4B)。通过 Ollama 这一本地大模型运行平台,开发者可以在消费级硬件(如笔记本、Raspberry Pi 类设备)上直接运行该模型,重点面向 Agent 构建与运行场景。
该模型的另一关键词是 Pi 轻量级 Agent 运行时(Pi lightweight agent runtime)的配合使用。Pi 是 NVIDIA 官方推出的轻量 Agent 运行时框架,目标是让 Agent 逻辑能在端侧设备上高效执行,Nemotron 3 Nano 4B 正是为这一组合场景「量身定制」的推理底座。
解决什么问题
当前 Agent 落地面临两难:强模型太贵、弱模型不够用。Nemotron 3 Nano 4B 的核心策略是——用足够小的模型(4B)覆盖 Agent 的「规划 + 工具调用」核心能力,同时在受限硬件上可接受地运行,而非追求通用对话质量。
典型场景包括:本地 IoT 设备上的指令解析、Raspberry Pi 上的简单任务自动化、离线环境下的边缘推理节点。
继续阅读深度解读 + 编辑加注
下方还有 3-5 段深度分析 + Vincent 编辑加注 + 可点击信源,仅 Pro 会员可见
加入机智流 PRO →¥99 / 季 · 每周 1 篇深度研报 · 飞书+微信群双通道
已是 Pro 但仍被提示?联系反馈
- Ollama 官方公告 · 2026-03-18
- NVIDIA Pi Agent Runtime 介绍 · 2025-10-01
- Phi-3-mini 技术报告 · 2024-04-01