AI这周真的炸了：黄仁勋亲口说算力成本降10倍，马斯克要自己造芯片

DeepSeek V4 再度跳票，2026年3月的模型大战进入白热化——这四件事，你得认真看

本周的 AI 圈安静不下来。英伟达 GTC 2026 刚在圣何塞开幕，黄仁勋皮衣上台一口气抛出好几个重磅；马斯克宣布要花 250 亿美元亲自造芯片；DeepSeek V4 又一次把发布时间往后推；与此同时，2026 年 3 月已经悄悄成为史上大模型发布最密集的一个月。这四条新闻，展开来都有不少说头。

黄仁勋说：推理成本要降 10 倍，这不是 PPT

事件：NVIDIA GTC 2026 主题演讲，Vera Rubin 正式量产，Feynman 2028 年预告

北京时间 3 月 17 日凌晨，黄仁勋在圣何塞一座能装 1.8 万人的冰球馆里发表了 GTC 2026 主题演讲，这大概是科技圈里唯一能把芯片发布做成演唱会气氛的场合。

今年的核心发布有两个层面。当下层面：Vera Rubin GPU 确认已进入全面量产，旗舰配置 VR200 NVL144 机架可集成 144 颗 GPU。和上一代 Blackwell Ultra 相比，推理性能提升 5 倍，每个 Token 的推理成本降低整整 10 倍——黄仁勋的原话是"自 Transformer 架构诞生以来，AI 计算经济学上最大的单次转变"。HBM4 内存带宽超过 3.0 TB/s，这个数字对做大模型推理的公司来说相当关键。

未来层面：2028 年的 Feynman 芯片提前亮相预告。1.6nm 台积电 A16 制程、硅光子光互连（带宽密度提升 10 倍、传输能耗降低 90%），还有 3D 堆叠 LPU 集成，把千亿参数大模型的训练时间从 10 天压到 4 天。2027 年还有一个过渡版本 Vera Ultra，整条路线图清晰得让人觉得英伟达是认真在做三年计划的那种公司。

软件侧，英伟达发布了开源 AI 智能体平台 NemoClaw，定位是"CUDA 在 Agent 层的翻版"——硬件无关、一站式、从训练到部署全流程，已与腾讯、百度等国内企业启动合作。

说实话，每年 GTC 都让人有点审美疲劳，但今年 Vera Rubin 的"降本 10 倍"如果落地，对整个 AI 应用市场的影响是实实在在的——便宜的算力意味着更多商业模式变得可行。

▲ AI 芯片算力持续跃升，英伟达 Vera Rubin 推理成本降低 10 倍

马斯克要自己造芯片，还要干到台积电的七成产能

事件：特斯拉 Terafab 项目 3 月 21 日正式启动，规模 250 亿美元

3 月 15 日，马斯克在 X 上宣布：Terafab Project 将于 3 月 21 日正式启动。话不多，细节也刻意模糊，但背后的数字颇为吓人。

Terafab 是特斯拉垂直整合 AI 芯片制造的超大规模项目，目标每年生产 1000 亿至 2000 亿颗 AI 芯片，长期晶圆产能目标是每月 100 万片——约相当于台积电当前总产量的 70%。项目计划投入约 250 亿美元，采用最先进的 2nm 制程，小批量生产预计 2026 年开始，2027 年大规模量产。

为什么要这么做？马斯克的逻辑很直接：特斯拉、SpaceX 和 xAI 加在一起，每年需要的 AI 芯片可能高达一两千亿颗，现有的台积电和三星根本排不上队。Optimus 人形机器人、Cybercab 机器人出租车、FSD 全自动驾驶——这三条产品线的芯片需求，靠外采实在太不稳定。

当然，质疑的声音也很响：建晶圆厂被认为是全球最难的工业挑战之一，需要数十年积累的专业知识，而马斯克的激进时间表历史上兑现率参差不齐。不过，这件事光是"宣布要做"，就已经足以让整个半导体供应链重新紧张起来了。

3 月 21 日的正式发布活动，应该会透露更多硬细节。

▲ 马斯克计划以 250 亿美元打造 Terafab，建立 AI 芯片自主供应链

DeepSeek V4 又跳票了，但这次跳的是方向

事件：DeepSeek V4 确认 4 月上线，推迟背后是开源路线的战略转型

3 月 12 日，据白鲸实验室独家爆料，DeepSeek V4 将于 4 月正式上线，而不是此前多次传言的"本周上线"。这是 V4 第三次推迟，AI 圈这回的反应从激动变成了习以为常。

但推迟本身其实没那么重要，值得关注的是推迟背后的原因。36氪的深度报道揭示了三点：

其一，V4 不是在做"更大的 V3"，而是在重构 Agent 能力——训练数据涵盖 1800+ 真实环境、8.5 万+ 复杂指令，主攻长任务可靠性，合成与验证周期自然变长。其二，DeepSeek 背负"开源标杆"的品牌压力，不能发一个只是微增性能的版本出来，否则口碑反噬比推迟更伤。其三，也是最有意思的：V4 计划深度适配华为昇腾等国产芯片，成为首个完全基于国产算力生态的旗舰级大模型，底层架构调整工程量大。

从 OpenRouter 上悄然出现的 Healer Alpha / Hunter Alpha 两个神秘 Alpha 模型来看，V4 的技术路线方向已经清晰：多模态 + 长期记忆 + Agent 闭环。如果 4 月能兑现，DeepSeek 还是那个 DeepSeek；如果再次推迟，竞争对手的注意力收割就要完成了。

"不是越来越慢，是在做越来越难的事。" ——某开发者对 V4 跳票的评价

▲ DeepSeek V4 确认 4 月发布，专攻 Agent 能力与国产芯片适配

2026 年 3 月：史上最内卷的大模型发布月

事件：GPT-5.4、Claude 4.6、Gemini 3.1、DeepSeek V4 同台竞技

这个月值得单独说一下。在不到两周时间里，GPT-5.4 Thinking（3月5日）、Claude Opus 4.6（3月8日）、DeepSeek V4（3月9日）、Gemini 3.1（3月12日）相继发布——四家顶级实验室几乎同步亮出了自己的最强底牌。

从基准测试看，没有一家能全面碾压：

模型	MMLU-Pro	编码 (HumanEval+)	数学推理	长上下文检索
GPT-5.4 Thinking	92.1%	95.3%	84.2%	94.6%
Claude Opus 4.6	91.4%	96.8%	81.6%	97.2%
DeepSeek V4	90.8%	94.1%	79.3%	93.8%
Gemini Deep Think	91.7%	93.5%	90.0%	91.4%

每家都有自己的擂主赛道：Claude 4.6 写代码和处理超长文档最稳，Gemini Deep Think 解数学题据称达到了"解决未解问题"的程度，GPT-5.4 的"思维过程可见"对企业合规场景有独特吸引力，DeepSeek V4 则是唯一一个开源 + 极致性价比的选手。

更深层的变化是：开源与闭源之间的差距，第一次缩小到了肉眼几乎难以区分的程度。这对整个行业的商业模式，影响远比某条基准分数更深远。

▲ 2026年3月，GPT-5.4、Claude 4.6、Gemini 3.1、DeepSeek V4 同台竞技

今日速览

主角	事件	核心数据	影响
NVIDIA	GTC 2026，Vera Rubin 量产	推理成本降 10 倍，性能升 5 倍	算力经济学重构
特斯拉	Terafab AI 芯片工厂 3/21 启动	250 亿美元，年产 2000 亿颗芯片	挑战台积电供应链主导权
DeepSeek	V4 确认 4 月发布	Agent 能力 + 国产芯片适配	中国开源路线战略转型
四大模型	3 月密集发布	Claude 编码最强，Gemini 数学最强	开源闭源差距空前缩小

结语

黄仁勋的 10 倍降成本，马斯克的 250 亿造芯片，DeepSeek 的再次等待，以及四家大模型同台的"无全能冠军"局面——这一周，AI 行业展现出了一种有意思的状态：硬件、软件、开源、闭源，所有人都在同时发力，但谁也没有建立起绝对壁垒。

算力便宜了，模型变强了，竞争更激烈了。对开发者来说，这是最好的时代；对各家大厂来说，护城河正在被一周一周地侵蚀。

接下来 3 月 21 日 Terafab 正式亮相，4 月 DeepSeek V4 还欠着一个答复。我们持续跟进。

AI这周真的炸了：黄仁勋亲口说算力成本降10倍，马斯克要自己造芯片

AI这周真的炸了：黄仁勋亲口说算力成本降10倍，马斯克要自己造芯片

黄仁勋说：推理成本要降 10 倍，这不是 PPT

马斯克要自己造芯片，还要干到台积电的七成产能

DeepSeek V4 又跳票了，但这次跳的是方向

2026 年 3 月：史上最内卷的大模型发布月

今日速览

结语

继续阅读