英伟达眼中的开放式AI Agent 世界

17611538698

info@21cto.com

登录注册

英伟达眼中的开放式AI Agent 世界

场长

人工智能 1 357 2026-03-20 12:37:02

21CTO导读：英伟达正用开放的思维架构引领人工智能技术。

近十多年来，也就是自英伟达将AI作为其战略和未来发展的核心以来，联合创始人兼首席执行官黄仁勋曾多次公开表示，这家领先的GPU制造商不再仅仅是一家硬件公司，而是人工智能领域的奠基者。

本周，在美国加州圣何塞举行的英伟达GTC 2026大会上，他再次重申了这一观点。

在展会开幕当天，黄仁勋主题演讲也包含很多硬件方面值得探讨的内容，包括从 Grace-Blackwell NVL72到Vera-Rubin NVL72的平台，以及英伟达的Groq语言处理单元 (LPU) 计划，然后是它的存储系统、互连与云端业务。

本次会议重点就是人工智能，而英伟达是该市场的主导者，黄仁勋计划保持这一地位，并愿意为此投入大量的真金白银。

这表示着英伟达要参与整个技术栈的开发，还要参与硬件层面的运行。

英伟达的关键领域之一是开发并提供运行在其基础设施上的开源高级人工智能基础模型和物理人工智能模型。

此举正值人工智能行业将重心从模型训练转向推理之际。自2023年11月发布首个开源模型Nemotron以来，英伟达在模型开放方面变得更加开放。该模型源自公司更广泛的NeMo框架，用于构建定制的生成式人工智能模型。

英伟达或许是唯一一家能够负担得起免费提供其模型的公司，因为它可以依靠人工智能系统实现盈利。对于Meta 来说，免费提供模型最终可能会付出过高的成本，而谷歌、OpenAI和Anthropic等公司则肯定不会这样做。

在过去的几年里，Nemotron 系列模型得到了显著扩展，其中不乏针对特定行业定制的开放式 AI 模型，黄仁勋在主题演讲中也提到了这些模型。列出的九个行业包括：智能体 AI、金融服务、医疗保健、工业、量子计算和电信。英伟达的开放式模型涵盖了所有这些行业，例如用于物理 AI 的 Cosmos、用于自动驾驶汽车的 Alpamayo 、用于生物学的 BioNeMo，以及最新的多模态模型 Nemotron 3，该模型专为多智能体系统而设计。

“这是英伟达的开放模型计划，”他说。“我们现在在人工智能模型的各个领域都处于领先地位，无论是Nemotron、Cosmos世界基金会模型、Groot，还是通用人工智能机器人——人形机器人模型——用于自动驾驶汽车的Alpamayo、用于数字生物学的BioNemo，以及用于人工智能物理学的Earth2。我们在每一个领域都处于领先地位。”

对于英伟达而言，推进开放模型至关重要，这不仅能使其摆脱硬件供应商的定位，更能使其成为运行在硬件之上的模型本身。英伟达正利用开放的模型来巩固这一优势，而且这些模型的成本远低于其他公司开发和拥有的模型。

黄仁勋和英伟达其他成员亦对这项技术充满信心，他们称将在未来五年内为此至少投资 2600 万美元。

在展会上，英伟达扩展了其去年首次推出的 Nemotron 3 开源型号系列，其中包括 Nemotron 3 Ultra，该型号利用了供应商在 Blackwell GPU 平台上的 NVFP4 格式，旨在运行编码助手、搜索和工作流自动化等应用程序。

Nemotron 3 的其他新型号还包括 Omni，它集成了音频、视觉和语言理解功能，能够比同类产品更高效、更准确地从视频和文档中提取信息；以及 VoiceChat，它结合了语音识别、大型语言模型 (LLM) 处理和文本转语音技术，使 AI 能够在实时对话中同时聆听和回应。此外，还有用于检测文本和图像中不安全内容的安全模型，以及用于提高模型输出相关性和准确性的检索管道。

此外，此次发布的模型还包括 NemoClaw，它将安全和隐私保护措施以及治理功能融入到广受欢迎的 OpenClaw 智能个人助理中。OpenClaw 正被企业和个人用户迅速采用，但一直受到安全问题的困扰。黄仁勋表示，现在，当企业希望将 OpenClaw 集成到自身环境中时（他提到英伟达内部正在使用 OpenClaw），他们可以使用包含安全功能的 NemoClaw 模型。

在展会开幕前几天，英伟达发布了 Nemotron 3 Super，该模型拥有 120 亿个活跃参数和 1200 亿个参数，旨在提高计算效率和准确性，这对于多智能体系统来说至关重要。该系统可以生成标准聊天记录 15 倍的令牌，通过重新发送历史记录、工具输出和推理步骤，造成英伟达开发人员所说的“上下文爆炸”，最终导致智能体偏离其原始目标。

英伟达的开发人员通过架构改进解决了在效率和准确性之间取得平衡时常见的权衡问题，包括使用潜在混合专家模型，该模型通过在令牌到达专家之前对其进行压缩，以相同的推理成本调用四倍数量的专家；以及多令牌预测，该模型可在一次遍历中预测多个未来令牌，从而减少长序列的生成时间并支持内置的推测性解码。

他们还将用于提高序列效率的 Mamba 层与用于精确推理的 Transformer 层集成在一起，从而在内存和计算效率提升四倍的同时，实现更高的吞吐量。

Nemotron 3 Super 的研发工作呼应了黄仁勋在主题演讲中的态度，即英伟达打算继续研发这些型号，并向各个组织机构保证，签约这些型号将是明智的选择。

“我们将继续推进这些模型——垂直整合、水平开放——以便让每个人都能参与到人工智能革命中来，”他说道。“我们希望打造一个基础模型，让大家都能对其进行微调和后训练，最终获得所需的智能。Nemotron 3 Ultra 将成为全球有史以来最好的基础模型。这将使我们能够帮助每个国家构建自主人工智能，我们正在与众多公司开展合作。”

这些公司中有些是英伟达新成立的Nemotron联盟（英伟达称之为Nemotron 4）的成员。

该联盟汇聚了模型构建者和人工智能开发者，旨在通过联合研究、数据和计算资源，推进英伟达前沿开放模型的开发。首批加入的公司包括Black Forest Labs、Cursor、LangChain、Mistral AI、Perplexity、Reflection AI、Sarvam和Thinking Machines Lab。

英伟达称，该联盟的首个项目是一个基础开放模型，将由Mistral AI和英伟达联合开发，并在英伟达的DGX云平台上进行训练。其他成员将提供数据、评估和领域专业知识，以支持训练后的工作和持续开发。该模型将成为即将推出的Nemotron 4模型之基础。

黄仁勋这样总结：

“我们已投入数十亿美元用于人工智能基础设施建设，以便开发人工智能的核心引擎，这些引擎不仅是所有推理库等所必需的，而且还能创建人工智能模型，从而激活全球各行各业。我曾说过，全球每一家企业、每一家软件公司都需要一个智能体系统，需要一套智能体策略。你需要一套OpenClaw策略，他们都认同这一点，并且都在与我们合作，整合Nemo、NemoClaw参考设计、Nvidia智能体人工智能工具包，当然还有我们所有的开放模型。”

作者：场长

本篇文章为 @ 场长创作并授权 21CTO 发布，未经许可，请勿转载。

内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 微信公众号。

该文观点仅代表作者本人，21CTO 平台仅提供信息存储空间服务。

场长

标准用户

英伟达眼中的开放式AI Agent 世界

评论

场长

最新文章

Linus Torvalds 谈 Linux 内核中...

Anthropic报告称，Claude现在负...

ChatGPT的市场份额首次跌破50%

面向 Ruby 开发者的 Go 语言学习...

Cursor 与25 岁创始人 Michael T...

告别两难抉择：Deno Desktop 登...

TypeScript 7 RC：编译器用 Go...

不看学历看实力！ 27岁工程师成...

Anthropic 发布 Claude Code 经...

Linux 7.2 内核将移除苹果 Apple...

我要赞赏作者

分享到微信