达道宝配资APP下载当英伟达开始卖CPU

2026年5月19日，英伟达副总裁伊恩·巴克亲自开车，将第一批Vera CPU送到了Anthropic、OpenAI、SpaceXAI、甲骨文。

这个场景本身就值得玩味：全球GPU霸主的高管，亲手交付的不是GPU，而是CPU。

Vera是英伟达历史上第一款完全自研的数据中心CPU。88个定制Olympus核心，1.2 TB/s内存带宽，台积电N3制程，Armv9.2指令集。在此之前，英伟达的Grace CPU虽然已经在市场上站稳了脚跟，但Vera是一个完全不同量级的宣言：英伟达不再满足于做AI算力的“半边天”，它要拿走整个天空。

甲骨文云当天宣布，将在2026年部署数十万颗Vera CPU，成为首个大规模采用Vera的云服务商。

这不是一次普通的产品交付。这是算力产业结构的一次地壳运动。

Agent时代的CPU觉醒

要理解Vera为什么在这个时间点出现，必须先理解AI产业正在经历的一次范式跃迁。

过去三年，AI的主旋律是“训练为王”。谁有更多的GPU，谁就能训练更大的模型。在这个逻辑下，CPU只是配角。一台典型的AI训练服务器，CPU与GPU的配比是1:8，CPU的存在感约等于一个“接线员”：负责调度数据、管理内存、协调IO，但真正的计算重任全部交给GPU。

但是2026年，随着Agent（智能体）时代到来了，游戏规则彻底变了。

Agent（智能体）时代到来了。ChatGPT、Claude、Gemini，这些大模型不再只是“你问我答”的聊天机器人，而是能够自主规划、调用工具、协调多个子任务的智能代理。一个典型的Agent工作流是这样的：用户给出一个复杂目标，Agent先做一次推理生成执行计划，然后拆分成多个子Agent并行运行，每个子Agent可能要调用API、查询数据库、抓取网页、进行独立的推理链。这些子任务完成的时间完全不同，依赖关系错综复杂，CPU必须以极低的延迟去监控每个token流、判断子Agent状态、整合中间结果。

在这种工作模式下，GPU负责的是“思考”，CPU负责的是“行动”。而行动的复杂度，在Agent时代呈指数级增长。

从行业经验来看，在典型的Agent工作流中，CPU处理延迟占比高达90%，成为端到端性能的头号瓶颈。这意味着，过去“堆GPU就能提效”的逻辑彻底失效了。你的GPU再快，如果CPU跟不上Agent的调度节奏，整个系统的性能都会受到影响。

AMD CEO苏姿丰在2026年第一季度财报电话会上明确表示：CPU与GPU的配比正从1:8逐步接近1:1，预计服务器CPU年增速将超过35%。

这就是Vera诞生的时代背景：不是英伟达突然心血来潮想做CPU，而是Agent让CPU从配角变成了主角。

Vera背后的技术野心

Vera不是一款“凑合用”的CPU。从技术规格看，它的每一个设计决策都在传递同一个信号：为AI Agent而生！

核心架构：Olympus是英伟达从零开始设计的定制核心，指令处理通道比主流CPU宽一倍，还内置了AI驱动的分支预测器，能更准确地"猜对"程序下一步要执行什么。这种设计不追求什么都能做，而是专门为AI推理中的任务调度和数据搬运做到极致。

内存系统：Vera配备1.5 TB超大内存，总带宽达到1.2 TB/s，相当于每秒能搬运1.2万部高清电影的数据量。为什么需要这么大？因为Agent同时处理多个任务时，每个任务的对话上下文、中间计算结果都要驻留在内存中随时调用，内存不够大、不够快，Agent就会"卡壳"。

互联设计：Vera CPU和Rubin GPU之间通过1.8 TB/s的专用高速通道（NVLink-C2C）直连，两者的内存可以互相访问，就像打通了一堵墙，变成一个大房间。传统架构中CPU和GPU之间搬数据是最大的性能瓶颈，Vera的做法是让它们共享同一个内存空间，从根本上消除这个瓶颈。

指令集：完全兼容Arm架构的主流软件生态，迁移成本低。同时它是首款支持FP8精度的CPU。简单说，FP8是一种"够用就好"的数据格式，用更少的存储空间完成AI计算，让同样的硬件能同时处理更多的Agent任务。

机架级设计：一个液冷机柜可以塞进256颗Vera CPU，超过2.2万个计算核心同时工作。更值得关注的是Vera Rubin NVL72机架：72颗GPU搭配36颗CPU，比例是2:1。而过去的AI集群通常是1颗CPU搭配8颗GPU。配比的剧烈变化，直观反映了Agent时代对CPU的需求数量正在大幅翻倍。

从架构层面看，英伟达的设计哲学变了。过去行业的默认思路是"CPU是大脑，GPU是肌肉"，CPU指挥，GPU干活。英伟达的新思路是把两者设计成一对双引擎，地位对等、深度协同，谁也不是谁的附属品。这和英特尔、AMD仍然以CPU为中心的思路形成了鲜明对比。

三方博弈：英特尔的困境、AMD的抉择、英伟达的野心

Vera的交付，把服务器CPU市场推入了一个三方博弈的新格局。

英特尔：腹背受敌的前霸主

2026年第一季度，英特尔在服务器CPU市场的份额已经跌至54.9%，较去年同期的64.4%下降了近10个百分点。更致命的是，英特尔的18A制程良率问题持续困扰，Xeon 6+和Xeon 7两款旗舰产品的量产时间均可能推迟至2027年。

英特尔面临的不仅是AMD的正面进攻，更是Arm阵营的侧翼包抄。Arm架构处理器在服务器市场的份额已经从去年同期的11.5%跃升至17.7%，亚马逊的Graviton、微软的Cobalt、谷歌的Axion，再加上英伟达的Vera，Arm阵营正在对x86形成合围。

对英特尔而言，Vera的交付意味着一个更可怕的事实：英伟达这位GPU的王者，把战火烧到了因特尔的核心腹地。英特尔正在经历“腹背受敌”的困局。

AMD：增长中的焦虑

AMD是近年来服务器CPU市场最大的赢家。凭借霄龙（EPYC）系列的持续迭代，AMD的服务器CPU收入首次超过英特尔，市场份额达到27.4%，同比增长330个基点。

但AMD面临一个结构性挑战：它的故事仍然是"x86阵营里的更优选择"。AMD有霄龙CPU，也有Instinct MI系 GPU，但两者的互联深度不及英伟达的NVLink-C2C，软件生态上ROCm与CUDA的差距更是老问题。当英伟达推出CPU+GPU深度耦合的一站式方案时，AMD面对的不是单点竞争，而是整个体系的压力。

更值得关注的是，CPU市场的扩大未必利好AMD。英伟达Vera对外销售直接抢份额，而亚马逊、微软、谷歌等云巨头纷纷自研Arm架构CPU自用，留给AMD的增量空间正在被两面挤压。

英伟达：从赢家到通吃

Vera的战略意图非常清晰：英伟达要从“AI计算的GPU供应商”升级为“AI基础设施的全栈供应商”。

算一笔账：英伟达2026财年数据中心收入为1935亿美元，几乎全部来自GPU及相关产品。UBS预计全球服务器CPU市场到2030年将从300亿美元扩大到1700亿美元，Arm架构预计占40%至45%。如果英伟达能在Arm服务器CPU市场拿下哪怕20%的份额，这就是一个超过300亿美元的增量市场。

但更深层的逻辑不在于“多卖一颗CPU”。英伟达真正要做的，是让客户在整个AI基础设施栈中都依赖英伟达：GPU用Rubin，CPU用Vera，网络用ConnectX-9 SuperNIC和BlueField-4 DPU，软件用CUDA和NEMO。当一个客户买了Vera Rubin NVL72机架，他买到的不是一堆散件，而是一个完整的、优化过的、高度耦合的AI工厂。

这是一种“苹果式”的垂直整合策略，只不过发生在数据中心领域。

算力产业的结构重组

那么，Vera到底是“改变”还是“颠覆”当前的市场格局？

更精确的描述是“重组”。

Vera不会让英特尔和AMD一夜之间倒下。服务器CPU是一个庞大而复杂的生态系统，涉及操作系统兼容性、软件生态、供应链关系、客户迁移成本等多个维度。英特尔的x86架构在通用计算、企业级应用、数据库、虚拟化等领域仍然拥有深厚的生态护城河。AMD的霄龙在性价比和核心密度上依然具有强劲的竞争力。

但Vera正在做的，是重新定义“AI Agent 时代的CPU应该是什么样子”。

第一，CPU从通用走向专用。传统的服务器CPU追求的是“什么都能做”。但Vera的设计哲学是“为AI Agent做到最好”。88个定制核心、神经网络分支预测器、FP8支持、超高内存带宽，这些设计在通用计算场景下未必是最优选择，但在AI Agent的调度和编排场景下，可以释放巨大的性能红利。这种“场景专用化”的趋势，会迫使英特尔和AMD也走向类似的道路。

第二，CPU-GPU的边界正在模糊。 Vera与Rubin通过NVLink-C2C形成一致性内存互联，CPU和GPU的内存可以统一寻址。这意味着传统的“CPU负责控制，GPU负责计算”的分工正在被打破。未来的AI计算单元，可能不再是“一颗CPU加几颗GPU”，而是一个高度耦合的异构计算集群，CPU和GPU的界限越来越难以划清。

第三，Arm正在成为数据中心的主流架构。 Vera选择Arm而非x86，是一个战略性的选择。Arm架构在能效比上的优势，在数据中心电力成本飙升的背景下变得越来越重要。2026年第一季度，Arm在服务器CPU市场的份额已经达到17.7%，同比增长超过6个百分点。UBS预计到2030年，Arm在服务器CPU市场的份额将达到40%至45%。Vera的大规模交付，将加速这一趋势。

第四，垂直整合正在取代水平分工。过去几十年，半导体产业的主旋律是“水平分工”：英特尔/AMD做CPU，英伟达做GPU，博通做网络芯片，各司其职。但英伟达通过Vera + Rubin + ConnectX + BlueField + CUDA的全栈布局，正在打破这种分工模式。谷歌（TPU + Axion）、亚马逊（Trainium + Graviton）、微软（Maia + Cobalt）也在走类似的道路。数据中心正在从“买散件组装”走向“买整体解决方案”。这种结构的重组，对整个产业链的影响是深远的。

算力产业的“平台化”时刻

如果我们把视野拉得更远，Vera交付的意义远超一颗CPU本身。

回顾科技产业的历史，每一次重大的平台变迁，都伴随着一次“全栈整合者”的崛起。PC时代的微软（Windows + Office），移动时代的苹果（iPhone + iOS + App Store），云时代的亚马逊（AWS的计算+存储+网络+数据库全家桶）。这些赢家的共同特征是：他们不只是提供某个环节的最优解，而是提供了一个“平台”，一个让所有其他参与者在其上构建价值的生态系统。

英伟达正在做同样的事情。CUDA不是一个软件库，而是一个锁定了数百万开发者的编程平台。Vera + Rubin不只是CPU + GPU，而是一个深度耦合的AI计算平台。NVLink不只是一条总线，而是一个连接数千颗芯片的通信平台。

当英伟达的Ian Buck亲手把Vera交给Anthropic的时候，他交付的不只是一颗处理器。他交付的是一把钥匙，一把打开“英伟达全栈AI工厂”大门的钥匙。一旦客户使用了Vera + Rubin的组合，他就进入了英伟达的生态体系，切换成本将变得极其高昂。

这就是Vera真正的战略意义：它不是英伟达的一次产品线扩展，而是英伟达从“芯片公司”向“平台公司”转型的关键一步。

对中国算力产业的冷思考

Vera的交付对中国算力产业有着特殊的含义。

英伟达通过Vera展示了一种全新的可能性：用Arm架构的CPU，配合自研的GPU和互联技术，构建完整的AI基础设施。这给中国算力产业带来了两个启示。

一是Arm架构为CPU的自主可控提供了一条可行路径。Arm的授权模式允许被授权方进行大幅度的定制设计，英伟达的Olympus核心就是一个典型例子。中国的CPU设计公司，如飞腾、鲲鹏（华为），也在Arm架构上积累了多年经验，可以借鉴Vera的思路，设计面向AI Agent场景优化的处理器。

二是CPU-GPU一体化的趋势，对中国企业既是挑战也是机遇。挑战在于，如果未来AI基础设施走向全栈整合，单做CPU或单做GPU的企业可能陷入被动。机遇在于，中国有华为这样同时拥有CPU（鲲鹏）和GPU（昇腾）设计能力的企业，如果能实现类似Vera + Rubin的深度耦合，可能在AI基础设施的自主可控上走出一条差异化路径。

当GPU之王开始做CPU，世界在改变

回到开头的那个画面：英伟达副总裁驱车穿越旧金山，亲手交付第一批Vera CPU。

这个画面之所以值得铭记，不是因为一颗CPU有多重要，而是因为它标志着一个时代的转折。AI产业正在从“训练为王”走向“Agent为王”，算力需求正在从“GPU独大”走向“CPU-GPU协同”，产业格局正在从“水平分工”走向“垂直整合”。

英伟达通过Vera，向整个产业宣告：在AI的下一个篇章里，它不只是要做最好的GPU，它要做最好的AI计算平台。

在Agent时代，单靠一颗CPU打天下的时代结束了。谁能提供CPU + GPU + 网络 + 软件的全栈解决方案，谁才能赢得下一个十年。

而黄仁勋，又一次站在了正确的位置上。

淘配网提示：文章来自网络，不代表本站观点。