← 返回资讯列表

Llama 4 开源:89.7%跑分压过GPT-4,部署成本只要十分之一

Llama 4 开源:89.7% 跑分压过 GPT-4,部署成本只要十分之一

cover

开源、标准、硬件——三条线同时推进,指向同一个结论:AI 正从"聊天工具"变成"基础设施"。


01 Llama 4 开源:89.7% 跑分压过 GPT-4

file 20260404122611103 Meta 这次是真下了血本。

Llama 4 系列一口气推出三个版本:Mini、Base、Ultra。最大的 Ultra 版本总参数 1.2 万亿,但采用 MoE(混合专家)架构,实际激活参数只有 220 亿。

什么意思?相当于养了一个 100 人的团队,但每次只叫 6 个人开会。效率高,成本低。

基准测试成绩单更亮眼:

  • MMLU、HumanEval、GSM8K 等多项测试平均得分 89.7%
  • 超过 GPT-4 的 88.5%

这是开源模型第一次在综合跑分上压过闭源巨头。

推理速度也提升了 30%。总参数翻了倍,但推理反而更快——MoE 架构的优势体现出来了。

更关键的是,Meta 把训练代码和数据集一起开源了。2 万亿 token 的高质量数据,Apache 2.0 协议,商用也没问题。

中小企业和研究机构,有了真正可用的"平民武器"。

说实话,开源社区已经很久没有这么兴奋了。

📌 对你意味着什么:如果你在做 AI 应用开发,现在有了性能足够强、成本可控的开源模型选择。部署成本大概只有 GPT-4 API 的十分之一。


02 英伟达砸 20 亿美元押注硅光子:破解 GPU 集群瓶颈

file 20260404124004896

英伟达向迈威尔科技投资了 20 亿美元,联合研发硅光子互连技术。

为什么?

因为 GPU 单卡性能已经不是瓶颈了,卡和卡之间的"沟通"才是。

现在的 AI 训练,动辄几千张 GPU 并行。卡越多,通信延迟越严重。

就像一个 1000 人的公司,每个部门之间都靠传真机沟通。效率可想而知。

硅光子技术用光信号替代电信号传输数据。带宽更高,延迟更低,功耗更省。

英伟达计划 2027 年推出首款集成硅光子引擎的 AI 加速卡,目标是:

  • 千卡集群通信延迟降低 80%
  • 能效比提升 5 倍以上

这听起来像硬件层面的新闻,但影响的其实是所有 AI 应用开发者。

当算力集群的效率翻倍,推理成本就有可能腰斩。而成本,是 AI 应用能否大规模落地的核心变量。

📌 对你意味着什么:如果你在做大规模 AI 部署,未来两年要关注硅光子技术进展。等英伟达的新卡出来,集群成本可能会有明显下降。


03 6G 芯片来了:单通道 1Tbps,5G 峰值的 100 倍

清华大学和中科院联合研发了全球首款面向 6G 全频段的超宽带光电融合芯片。

关键数字:

  • 单通道传输速率 1 Tbps,是 5G 峰值速率的 100 倍
  • 功耗降低 60%
  • 频段覆盖从 sub-6 GHz 到太赫兹(0.1-10 THz)

这可能听起来离应用有点远。但想想 5G 刚出来时,大家也在说"有什么用"。

现在呢?自动驾驶、远程手术、工业物联网,都离不开高带宽低延迟的网络。

6G 的潜力更大——当带宽提升两个数量级,边缘计算、端侧 AI Agent、实时 AR/VR 都有了跑起来的可能。

芯片有了,离商用还有多久?

清华大学团队的回答是"为 6G 商用奠定硬件基础"。按照通信行业的节奏,2028-2030 年可能是 6G 真正落地的窗口期。


04 微软 Copilot Cowork:双模型引擎,任务超 15 分钟自动切换

file 20260404124246990

微软发了款新产品:Copilot Cowork

最大亮点是集成 GPT-4 和 Claude 两个模型引擎。

为什么用两个模型?

因为不同模型擅长的事不一样。GPT-4 写代码强,Claude 处理长文本更稳。

Copilot Cowork 的逻辑是:任务耗时超过 15 分钟,自动切换到更合适的模型继续干

月费附加 15 美元,内置于 Microsoft 365 企业版。

这释放了一个信号:企业级 AI 工具正在从"单一模型"转向"多模型协作"。

过去一年,各家大模型厂商都在卷"谁的模型更强"。但对企业用户来说,最强的模型不一定是最合适的——成本、稳定性、隐私合规,每个维度都要权衡。

微软的做法是把选择权交给系统,让 AI 自己判断该用哪个模型。

这可能是未来企业 AI 工具的主流形态。

📌 对你意味着什么:如果你在企业内部部署 AI 工具,可以借鉴微软的思路:不押注单一模型,而是根据任务类型动态选择,平衡性能和成本。


结语

五条新闻,五个方向:开源模型、行业标准、算力硬件、通信底座、企业工具。

看起来各不相干,但组合在一起,指向一个趋势——AI 正从"对话式工具"变成"基础设施"。

当开源模型性能逼近闭源,当行业标准开始落地,当算力瓶颈被硅光子破解,当 6G 芯片铺开,当企业工具学会多模型协作——AI 不再只是"聊天机器人",而是渗透进每个行业的水电煤。

这个转变,可能比任何一个模型的发布都重要。

cover merged

继续阅读

查看全部