← 返回资讯列表

Cursor摊牌了:底层是Kimi,马斯克也来凑热闹

Cursor摊牌了:底层是Kimi,xAI上门抢客,WordPress开始用AI写文章

xAI派工程师驻场抢OpenAI客户、阿里千问杀入LMArena全球实验室前五、WordPress给43%的网站接上AI智能体——3月21日AI速报


过去48小时,AI圈的热闹程度有点出乎意料。一个代码编辑器被"认亲",一家公司派工程师上门硬抢对手客户,一个模型悄悄杀进全球实验室前五,还有覆盖全球43%网站的底层引擎开始让AI代写文章。

四件事,挨个说。


01. Cursor发布新模型,结果被Kimi认出来了

3月19日,Cursor正式发布了Composer 2,主推代码能力大幅提升,价格还比GPT-5要便宜不少。社区里第一波反应是一片叫好。

然后就是第二波——有开发者翻了翻模型权重,发现Composer 2的底层跑的是月之暗面的Kimi K2.5,但Cursor在发布博客里一个字都没提。

争议随之而来。Kimi K2.5的开源协议里有条商业条款:月收入超2000万美元,或月活超1亿用户,就必须在界面上显著标注"Kimi K2"字样。Cursor这两个门槛大概率都过了,但产品页面上干干净净,完全看不到任何署名。

然后事情反转了。

月之暗面官方账号发帖,语气出奇地平和:"恭喜Cursor发布Composer 2,我们很自豪Kimi K2.5提供了基础。"同时澄清:Cursor是通过Fireworks AI平台授权访问的,属于正规商业合作。

Cursor联合创始人Aman Sanger也跟着出来认账,说当时没在发布说明里提Kimi确实是个失误,下次会改。

整件事的高潮是马斯克跑到相关帖子下面回了一句"Yeah, it's Kimi 2.5",然后这条评论的热度就超过了官方声明本身。

按Cursor团队披露的技术细节,他们在多个基座里跑了困惑度测试,Kimi K2.5表现最好,之后又做了继续预训练和4倍算力的强化学习。最终模型里,基座权重占大约1/4,Cursor自己训练的部分占3/4。

说白了,这是一次授权合作,只是发布时没说清楚,被社区逮个正着。


02. 马斯克派xAI工程师上门,直接从ChatGPT手里抢客户

3月20日,彭博社爆料了一个非常有马斯克风格的竞争策略:xAI正在把工程师直接派到潜在客户的办公室里,现场帮客户对接和调优Grok模型。

不是远程支持,不是开个会演示一下PPT——是真人驻场,手把手帮你把模型跑起来。

第一个公开案例是支付公司Shift4 Payments。创始人是马斯克的老朋友,之前SpaceX的Starlink客服自动化就是xAI做的。这次测试效果不错,Shift4决定在未来三个月内,把15个国家的客户服务从ChatGPT切换到Grok。合同金额数百万美元。

xAI的逻辑很直接:企业客户买AI模型不是买个API就完了,要对接内部系统、要调优、要处理数据安全合规——这些活儿光靠文档和客服搞不定,得有人盯着。OpenAI和Anthropic也在搞类似的部署服务,OpenAI甚至跟私募股权合作组建了专门的"部署部门",但xAI的方式更激进,直接把人塞进客户公司。

换个角度看,这说明AI模型的竞争已经从"谁的分数高"进入"谁能落地"的阶段。对企业客户来说,模型性能的差距远没有部署和适配的难度来得重要。谁的工程师能先帮你跑通流程,谁就能拿下这单。


03. 千问3.5登上LMArena实验室榜全球第五,国内模型集体杀入前20

3月20日,阿里把Qwen3.5-Max-Preview悄悄上线到LMArena盲测。

总榜上,1464分,排第14名。和第13名的Claude Sonnet 4.6(1465分)只差1分——一个投票量级的误差。

但更有意思的是LMArena的实验室排行榜。这个榜单每家实验室只取最高分,千问3.5在这个维度上拿到了全球第五。排在它前面的四个全是美国公司:

排名 实验室 模型 分数
1 Anthropic Claude Opus 4.6 Thinking 1502
2 Google Gemini 3.1 Pro Preview 1493
3 xAI Grok 4.20 Beta 1492
4 OpenAI GPT-5.4 High 1485
5 阿里 Qwen3.5 Max Preview 1464

前三名全在1485分以上,形成了一个小断层。千问和GPT-5.4之间差了21分,和第一名的Claude Opus 4.6差了38分——差距还是明显的,但已经挤进了头部竞争圈。

再往下看,国内实验室在前20里占了半壁江山:

排名 实验室 模型 分数
5 阿里 Qwen3.5 Max Preview 1464
6 字节 Dola Seed 2.0 Preview 1462
7 智谱 GLM-5 1455
8 月之暗面 Kimi K2.5 Thinking 1453
9 百度 文心5.0 1452
10 小米 MiMo-V2 Pro 1445

六家国内公司,从1464到1445,分差只有19分,咬得很紧。这个密度说明国内头部模型之间的竞争已经白热化了——稍不留神就会被追上或者反超。

千问的这个成绩还是个预览版,正式版还没发布。按照惯例,预览版通常不是性能天花板。

千问的前核心人物林俊旸3月初刚离职,外界一度担心会不会影响研发节奏。这次发布多少算是个回应——进度没掉。


04. WordPress全面接入AI智能体,全球43%的网站可能被AI接管

3月21日,WordPress.com正式宣布全面引入AI智能体。

用户只需输入自然语言指令,AI就能自动起草、编辑并发布文章,还能处理后台评论、优化SEO、修复图片替代文本。系统会先扫描网站的主题和设计风格,确保生成的内容在色彩、字体、排版上与原有风格统一。

技术层面,这套AI功能基于"模型上下文协议(MCP)"构建,支持用户接入ChatGPT、Claude Desktop、Cursor、VS Code等主流AI工具。生成的文章默认保存为草稿,需用户手动确认后才会发布。

听起来像是个方便的小功能,但数据让它变得严肃:WordPress驱动全球超过43%的网站,WordPress.com托管版的月浏览量达200亿次。这意味着,一旦AI智能体被广泛采用,互联网上的内容生产逻辑可能被彻底改写。

不过WordPress也留了条底线:所有AI操作都会记录在网站活动日志中,用户可以追踪哪些内容被修改过。但考虑到AI生成内容的门槛已经极低,未来互联网内容"机器含量"越来越高,基本是确定性事件。


速览

公司 动态 时间
Cursor Composer 2底层被曝使用Kimi K2.5,月之暗面确认为正规授权合作 3月19日
xAI 派工程师驻场企业客户,Shift4 Payments决定从ChatGPT切换至Grok 3月20日
阿里 Qwen3.5-Max-Preview登上LMArena实验室榜全球第五 3月20日
WordPress 全面接入AI智能体,支持自然语言指令自动写文章,覆盖全球43%网站 3月21日

结语

从Cursor这件事来看,AI工具领域的"基座依赖"已经是公开的秘密。自研能力不够的公司,都在不同程度地靠开源或授权模型撑台子,透明度参差不齐。Kimi这次借着反转,反而做了一波漂亮的品牌背书——被Cursor选用,本身就是一种认证。

xAI的"上门抢客"和LMArena实验室榜前10名里国内占了6席,是同一个趋势的两面:模型能力的竞争已经从跑分扩展到落地服务。谁基础模型追得更快,谁把客户服务做得更深,谁就少一个被卡脖子的可能。

WordPress这条信息量不大,但信号很强。当全球43%的网站底层引擎开始原生支持AI智能体,内容生产的成本结构和质量标准都会被改写。留个印象,看接下来几个月的实际采用率。


参考来源:

继续阅读

查看全部