123,123,123

ICC訊 NVIDIA 于 12 月 15 日宣布推出 NVIDIA Nemotron? 3 系列開(kāi)放模型、數(shù)據(jù)和庫(kù)，為各個(gè)行業(yè)透明、高效的專(zhuān)業(yè)代理式 AI 開(kāi)發(fā)提供助力。

Nemotron 3 模型提供 Nano、Super 和 Ultra 三種規(guī)模，采用突破性的異構(gòu)潛在混合專(zhuān)家 (MoE) 架構(gòu)，幫助開(kāi)發(fā)者大規(guī)模開(kāi)發(fā)并部署可靠的多智能體系統(tǒng)。

隨著企業(yè)從單模型對(duì)話機(jī)器人轉(zhuǎn)向協(xié)作式多智能體 AI 系統(tǒng)，開(kāi)發(fā)者面臨著日益嚴(yán)峻的挑戰(zhàn)，包括通信開(kāi)銷(xiāo)、上下文漂移和高推理成本等。此外，開(kāi)發(fā)者需要模型具備透明度，才能信任其用于自動(dòng)化復(fù)雜工作流。Nemotron 3 直面這些挑戰(zhàn)，為用戶(hù)提供開(kāi)發(fā)專(zhuān)業(yè)化代理式 AI 所需的性能與開(kāi)放性。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“開(kāi)放創(chuàng)新是 AI 進(jìn)步的基礎(chǔ)。通過(guò) Nemotron，我們將先進(jìn) AI 轉(zhuǎn)化成開(kāi)放平臺(tái)，為開(kāi)發(fā)者提供構(gòu)建大規(guī)模代理式系統(tǒng)所需的透明度與效率。”

NVIDIA Nemotron 為 NVIDIA 更廣泛的主權(quán) AI 工作提供支持。從歐洲到韓國(guó)，企業(yè)組織紛紛采用開(kāi)放、透明、高效的模型開(kāi)發(fā)符合自身數(shù)據(jù)、法規(guī)與價(jià)值觀的 AI 系統(tǒng)。

Nemotron 系列模型的早期用戶(hù)包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle Cloud Infrastructure、Perplexity、ServiceNow、西門(mén)子、新思科技和 Zoom。他們正將 Nemotron 系列模型集成到制造、網(wǎng)絡(luò)安全、軟件開(kāi)發(fā)、媒體、通信等行業(yè)的 AI 工作流中。

ServiceNow 董事長(zhǎng)兼首席執(zhí)行官 Bill McDermott 表示：“NVIDIA 與 ServiceNow 多年來(lái)一直致力于塑造 AI 的未來(lái)，而最好的部分尚未到來(lái)。今天，我們?cè)趲椭餍袠I(yè)領(lǐng)導(dǎo)者加速推進(jìn)代理式 AI 戰(zhàn)略方面邁出了重要的一步。通過(guò)結(jié)合 ServiceNow 的智能工作流自動(dòng)化與 NVIDIA Nemotron 3，我們將以出色的效率、速度與精度繼續(xù)定義行業(yè)標(biāo)準(zhǔn)?！?

隨著多智能體 AI 系統(tǒng)的擴(kuò)展，開(kāi)發(fā)者越來(lái)越依賴(lài)專(zhuān)有模型來(lái)實(shí)現(xiàn)前沿推理，同時(shí)使用更加高效、可定制的開(kāi)放模型降低成本。在單一工作流中于前沿級(jí)模型與 Nemotron 之間進(jìn)行任務(wù)路由，既能賦予智能體強(qiáng)大的智能，同時(shí)還可以?xún)?yōu)化 token 經(jīng)濟(jì)效益。

Perplexity 首席執(zhí)行官 Aravind Srinivas 表示：“Perplexity 的構(gòu)建理念是當(dāng)精準(zhǔn) AI 融入先進(jìn)工具時(shí)(例如 AI 助手)，人類(lèi)的好奇心將被放大。通過(guò)我們的智能體路由器，可以將工作負(fù)載定向到領(lǐng)先的精細(xì)調(diào)優(yōu)開(kāi)放模型，如 Nemotron 3 Ultra，或在任務(wù)能夠從其獨(dú)特能力中受益時(shí)，利用領(lǐng)先的專(zhuān)有模型，以此確保我們的 AI 助手能夠以卓越的速度、效率和規(guī)模運(yùn)行。”

Nemotron 3 開(kāi)放模型使初創(chuàng)公司能夠更快開(kāi)發(fā)和迭代 AI 智能體，并加快從原型到企業(yè)級(jí)部署的創(chuàng)新進(jìn)程。General Catalyst 和 Mayfield 旗下的投資組合公司正在探索如何使用 Nemotron 3 開(kāi)發(fā)支持人機(jī)協(xié)作的 AI 隊(duì)友。

Mayfield 管理合伙人 Navin Chaddha 表示：“NVIDIA 的開(kāi)放模型堆棧與 NVIDIA 初創(chuàng)加速計(jì)劃為初創(chuàng)公司提供了各類(lèi)模型、工具及經(jīng)濟(jì)高效的基礎(chǔ)設(shè)施，助力其開(kāi)展試驗(yàn)、實(shí)現(xiàn)差異化發(fā)展并快速擴(kuò)展規(guī)模。Nemotron 3 可以讓創(chuàng)始人在構(gòu)建代理式 AI 應(yīng)用和 AI 隊(duì)友方面取得先機(jī)，并幫助他們利用 NVIDIA 龐大的用戶(hù)基礎(chǔ)。”

Nemotron 3 以高效和精準(zhǔn)重塑多智能體 AI

Nemotron 3 系列 MoE 模型包含三種規(guī)模：

Nemotron 3 Nano：是一款具備 300 億參數(shù)的小型模型，每次運(yùn)行最多激活 30 億參數(shù)，適用于針對(duì)性、高效的任務(wù)。

Nemotron 3 Super：是一款具備約 1,000 億參數(shù)的高精度推理模型，每個(gè) token最多激活 100 億參數(shù)，適用于多智能體應(yīng)用。

Nemotron 3 Ultra：是一款具備約 5,000 億參數(shù)的大型推理引擎，每個(gè) token 最多激活 500 億參數(shù)，適用于復(fù)雜的 AI 應(yīng)用。

Nemotron 3 Nano 已正式上線，是計(jì)算成本效益極高的模型，其針對(duì)軟件調(diào)試、內(nèi)容摘要、AI 助手工作流及信息檢索等任務(wù)進(jìn)行了優(yōu)化，同時(shí)保持了較低的推理成本。該模型采用獨(dú)特的異構(gòu) MoE 架構(gòu)，以實(shí)現(xiàn)效率與可擴(kuò)展性的提升。

這一設(shè)計(jì)使其 token 吞吐量較 Nemotron 2 Nano 至高提升 4 倍，并減少了多達(dá) 60% 的推理 token 生成量，大大降低了推理成本。具備 100 萬(wàn) token 的上下文處理能力，Nemotron 3 Nano 具有更強(qiáng)的記憶能力，在處理長(zhǎng)時(shí)間多步驟任務(wù)時(shí)能更精準(zhǔn)地關(guān)聯(lián)信息。

獨(dú)立 AI 基準(zhǔn)測(cè)試機(jī)構(gòu) Artificial Analysis 評(píng)定該模型為同等規(guī)模模型中兼具極高開(kāi)放性和效率及卓越精度的模型。

在需要多智能體協(xié)作完成低延遲復(fù)雜任務(wù)的應(yīng)用中，Nemotron 3 Super 表現(xiàn)出色。Nemotron 3 Ultra 則作為高級(jí)推理引擎，服務(wù)于需要深度研究和策略規(guī)劃的 AI 工作流。

Nemotron 3 Super 與 Ultra 采用基于 NVIDIA Blackwell 架構(gòu)的超高效 4 位 NVFP4 訓(xùn)練格式，可顯著降低顯存需求并加速訓(xùn)練進(jìn)程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練，不會(huì)因更高精度格式而犧牲準(zhǔn)確性。

借助 Nemotron 3 系列模型，開(kāi)發(fā)者可根據(jù)特定工作負(fù)載選擇適配的開(kāi)放模型，在數(shù)十至數(shù)百個(gè)智能體間靈活擴(kuò)展，同時(shí)在復(fù)雜工作流中獲得更快速、精準(zhǔn)的長(zhǎng)時(shí)推理能力。

用于 AI 智能體定制的全新開(kāi)放工具與數(shù)據(jù)

NVIDIA 還發(fā)布了面向?qū)I(yè) AI 智能體開(kāi)發(fā)者的訓(xùn)練數(shù)據(jù)集與前沿強(qiáng)化學(xué)習(xí)庫(kù)集合。

3 萬(wàn)億 token 規(guī)模的全新 Nemotron 預(yù)訓(xùn)練、后訓(xùn)練及強(qiáng)化學(xué)習(xí)數(shù)據(jù)集，為開(kāi)發(fā)高性能特定領(lǐng)域智能體提供了豐富的推理、編碼及多步驟工作流范例。Nemotron Agentic Safety Dataset 則提供真實(shí)場(chǎng)景的遙測(cè)數(shù)據(jù)，幫助團(tuán)隊(duì)評(píng)估并提升復(fù)雜智能體系統(tǒng)的安全性。

為加速開(kāi)發(fā)進(jìn)程，NVIDIA 發(fā)布了 NeMo Gym 與 NeMo RL 開(kāi)源庫(kù)，為 Nemotron 模型提供訓(xùn)練環(huán)境及后訓(xùn)練基礎(chǔ)，同時(shí)還推出用于驗(yàn)證模型安全性和性能的 NeMo Evaluator。所有工具及數(shù)據(jù)集現(xiàn)已上線 GitHub 和 Hugging Face 平臺(tái)。

Nemotron 3 已獲得 LM Studio 、llama.cpp、SGLang 和 vLLM 支持。此外，Prime Intellect 與 Unsloth 正將 NeMo Gym 的即用型訓(xùn)練環(huán)境直接集成至其工作流，使團(tuán)隊(duì)能夠更加快速、便捷地獲得強(qiáng)大的強(qiáng)化學(xué)習(xí)訓(xùn)練能力。

開(kāi)始使用 NVIDIA 開(kāi)放模型

Nemotron 3 Nano 現(xiàn)已上線 Hugging Face 平臺(tái)，并通過(guò) Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI 等推理服務(wù)商提供。

Nemotron 還上線了多個(gè)企業(yè)級(jí) AI 與數(shù)據(jù)基礎(chǔ)設(shè)施平臺(tái)，包括 Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。此外，Nemotron 3 Nano 將通過(guò) Amazon Bedrock(無(wú)服務(wù)器模式)在亞馬遜云科技 (AWS) 平臺(tái)上提供給使用公有云的客戶(hù)，并且也即將支持 Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale 及 Yotta。

Nemotron 3 Nano 同時(shí)以 NVIDIA NIM 形式提供，可在 NVIDIA 加速基礎(chǔ)設(shè)施上進(jìn)行安全、可擴(kuò)展的部署，具有極高的隱私性與可控性。

Nemotron 3 Super 和 Ultra 預(yù)計(jì)將于 2026 年上半年推出。

關(guān)于 NVIDIA

NVIDIA (NASDAQ: NVDA) 是 AI 和加速計(jì)算領(lǐng)域的全球領(lǐng)導(dǎo)者。

NVIDIA 推出 Nemotron 3 系列開(kāi)放模型