
AI这周真的炸了:黄仁勋亲口说算力成本降10倍,马斯克要自己造芯片
DeepSeek V4 再度跳票,2026年3月的模型大战进入白热化——这四件事,你得认真看
本周的 AI 圈安静不下来。英伟达 GTC 2026 刚在圣何塞开幕,黄仁勋皮衣上台一口气抛出好几个重磅;马斯克宣布要花 250 亿美元亲自造芯片;DeepSeek V4 又一次把发布时间往后推;与此同时,2026 年 3 月已经悄悄成为史上大模型发布最密集的一个月。这四条新闻,展开来都有不少说头。
黄仁勋说:推理成本要降 10 倍,这不是 PPT
事件:NVIDIA GTC 2026 主题演讲,Vera Rubin 正式量产,Feynman 2028 年预告
北京时间 3 月 17 日凌晨,黄仁勋在圣何塞一座能装 1.8 万人的冰球馆里发表了 GTC 2026 主题演讲,这大概是科技圈里唯一能把芯片发布做成演唱会气氛的场合。
今年的核心发布有两个层面。当下层面:Vera Rubin GPU 确认已进入全面量产,旗舰配置 VR200 NVL144 机架可集成 144 颗 GPU。和上一代 Blackwell Ultra 相比,推理性能提升 5 倍,每个 Token 的推理成本降低整整 10 倍——黄仁勋的原话是"自 Transformer 架构诞生以来,AI 计算经济学上最大的单次转变"。HBM4 内存带宽超过 3.0 TB/s,这个数字对做大模型推理的公司来说相当关键。
未来层面:2028 年的 Feynman 芯片提前亮相预告。1.6nm 台积电 A16 制程、硅光子光互连(带宽密度提升 10 倍、传输能耗降低 90%),还有 3D 堆叠 LPU 集成,把千亿参数大模型的训练时间从 10 天压到 4 天。2027 年还有一个过渡版本 Vera Ultra,整条路线图清晰得让人觉得英伟达是认真在做三年计划的那种公司。
软件侧,英伟达发布了开源 AI 智能体平台 NemoClaw,定位是"CUDA 在 Agent 层的翻版"——硬件无关、一站式、从训练到部署全流程,已与腾讯、百度等国内企业启动合作。
说实话,每年 GTC 都让人有点审美疲劳,但今年 Vera Rubin 的"降本 10 倍"如果落地,对整个 AI 应用市场的影响是实实在在的——便宜的算力意味着更多商业模式变得可行。
▲ AI 芯片算力持续跃升,英伟达 Vera Rubin 推理成本降低 10 倍
马斯克要自己造芯片,还要干到台积电的七成产能
事件:特斯拉 Terafab 项目 3 月 21 日正式启动,规模 250 亿美元
3 月 15 日,马斯克在 X 上宣布:Terafab Project 将于 3 月 21 日正式启动。话不多,细节也刻意模糊,但背后的数字颇为吓人。
Terafab 是特斯拉垂直整合 AI 芯片制造的超大规模项目,目标每年生产 1000 亿至 2000 亿颗 AI 芯片,长期晶圆产能目标是每月 100 万片——约相当于台积电当前总产量的 70%。项目计划投入约 250 亿美元,采用最先进的 2nm 制程,小批量生产预计 2026 年开始,2027 年大规模量产。
为什么要这么做?马斯克的逻辑很直接:特斯拉、SpaceX 和 xAI 加在一起,每年需要的 AI 芯片可能高达一两千亿颗,现有的台积电和三星根本排不上队。Optimus 人形机器人、Cybercab 机器人出租车、FSD 全自动驾驶——这三条产品线的芯片需求,靠外采实在太不稳定。
当然,质疑的声音也很响:建晶圆厂被认为是全球最难的工业挑战之一,需要数十年积累的专业知识,而马斯克的激进时间表历史上兑现率参差不齐。不过,这件事光是"宣布要做",就已经足以让整个半导体供应链重新紧张起来了。
3 月 21 日的正式发布活动,应该会透露更多硬细节。
▲ 马斯克计划以 250 亿美元打造 Terafab,建立 AI 芯片自主供应链
DeepSeek V4 又跳票了,但这次跳的是方向
事件:DeepSeek V4 确认 4 月上线,推迟背后是开源路线的战略转型
3 月 12 日,据白鲸实验室独家爆料,DeepSeek V4 将于 4 月正式上线,而不是此前多次传言的"本周上线"。这是 V4 第三次推迟,AI 圈这回的反应从激动变成了习以为常。
但推迟本身其实没那么重要,值得关注的是推迟背后的原因。36氪的深度报道揭示了三点:
其一,V4 不是在做"更大的 V3",而是在重构 Agent 能力——训练数据涵盖 1800+ 真实环境、8.5 万+ 复杂指令,主攻长任务可靠性,合成与验证周期自然变长。其二,DeepSeek 背负"开源标杆"的品牌压力,不能发一个只是微增性能的版本出来,否则口碑反噬比推迟更伤。其三,也是最有意思的:V4 计划深度适配华为昇腾等国产芯片,成为首个完全基于国产算力生态的旗舰级大模型,底层架构调整工程量大。
从 OpenRouter 上悄然出现的 Healer Alpha / Hunter Alpha 两个神秘 Alpha 模型来看,V4 的技术路线方向已经清晰:多模态 + 长期记忆 + Agent 闭环。如果 4 月能兑现,DeepSeek 还是那个 DeepSeek;如果再次推迟,竞争对手的注意力收割就要完成了。
"不是越来越慢,是在做越来越难的事。" ——某开发者对 V4 跳票的评价
▲ DeepSeek V4 确认 4 月发布,专攻 Agent 能力与国产芯片适配
2026 年 3 月:史上最内卷的大模型发布月
事件:GPT-5.4、Claude 4.6、Gemini 3.1、DeepSeek V4 同台竞技
这个月值得单独说一下。在不到两周时间里,GPT-5.4 Thinking(3月5日)、Claude Opus 4.6(3月8日)、DeepSeek V4(3月9日)、Gemini 3.1(3月12日)相继发布——四家顶级实验室几乎同步亮出了自己的最强底牌。
从基准测试看,没有一家能全面碾压:
| 模型 | MMLU-Pro | 编码 (HumanEval+) | 数学推理 | 长上下文检索 |
|---|---|---|---|---|
| GPT-5.4 Thinking | 92.1% | 95.3% | 84.2% | 94.6% |
| Claude Opus 4.6 | 91.4% | 96.8% | 81.6% | 97.2% |
| DeepSeek V4 | 90.8% | 94.1% | 79.3% | 93.8% |
| Gemini Deep Think | 91.7% | 93.5% | 90.0% | 91.4% |
每家都有自己的擂主赛道:Claude 4.6 写代码和处理超长文档最稳,Gemini Deep Think 解数学题据称达到了"解决未解问题"的程度,GPT-5.4 的"思维过程可见"对企业合规场景有独特吸引力,DeepSeek V4 则是唯一一个开源 + 极致性价比的选手。
更深层的变化是:开源与闭源之间的差距,第一次缩小到了肉眼几乎难以区分的程度。这对整个行业的商业模式,影响远比某条基准分数更深远。
▲ 2026年3月,GPT-5.4、Claude 4.6、Gemini 3.1、DeepSeek V4 同台竞技
今日速览
| 主角 | 事件 | 核心数据 | 影响 |
|---|---|---|---|
| NVIDIA | GTC 2026,Vera Rubin 量产 | 推理成本降 10 倍,性能升 5 倍 | 算力经济学重构 |
| 特斯拉 | Terafab AI 芯片工厂 3/21 启动 | 250 亿美元,年产 2000 亿颗芯片 | 挑战台积电供应链主导权 |
| DeepSeek | V4 确认 4 月发布 | Agent 能力 + 国产芯片适配 | 中国开源路线战略转型 |
| 四大模型 | 3 月密集发布 | Claude 编码最强,Gemini 数学最强 | 开源闭源差距空前缩小 |
结语
黄仁勋的 10 倍降成本,马斯克的 250 亿造芯片,DeepSeek 的再次等待,以及四家大模型同台的"无全能冠军"局面——这一周,AI 行业展现出了一种有意思的状态:硬件、软件、开源、闭源,所有人都在同时发力,但谁也没有建立起绝对壁垒。
算力便宜了,模型变强了,竞争更激烈了。对开发者来说,这是最好的时代;对各家大厂来说,护城河正在被一周一周地侵蚀。
接下来 3 月 21 日 Terafab 正式亮相,4 月 DeepSeek V4 还欠着一个答复。我们持续跟进。