← 返回资讯列表

AI边界又往前推了一步

Claude 能"画图"了、Gemini 帮你叫 Uber、字节跳动因好莱坞叫停视频 AI、Meta 悄悄造好了自家 AI 芯片


最近,AI 圈有点忙。

不是那种"某某公司发了个 PPT"的热闹,而是真刀真枪落到产品里的那种更新。Claude 突然学会了"画图"、Gemini 开始帮你点星巴克、字节跳动的视频生成器在好莱坞门口撞了南墙——这几件事放在一起,其实在说同一件事:AI 正在从"能聊天的机器人"变成"真的能干活的东西"。

但这条路走得不那么顺。下面拆开说。


01 Claude 不再只会"说"了,它开始"画图"给你看

Claude 上线了一个低调但挺有意思的更新:图表和图解可以直接嵌在对话里了,不是弹到侧边栏,就在聊天流里,随着你问问题实时更新。

问它"建筑物的重量怎么传递",它不给你一堆文字,而是直接画一张力学图,追问一句图就跟着变。元素周期表的演示里,点击某个元素还会弹出详细数据——更像在用 App,不像在聊天。

和之前的 Artifacts(侧边栏持久化内容)有点区别,这个更随意、更轻——"顺手一画",而不是"专门生成一个文件"。

已向全量用户开放,默认开启,不需要任何设置。

图:AI 正在把数据分析能力直接带进对话——图表不再是附件,而是回答本身


02 Gemini 开始帮你叫 Uber 了,这次是认真的

"AI 帮你订外卖"这件事被吹了好几年。Gemini 这次真的做到了——不过得有一台三星 Galaxy S26 Ultra。

功能叫 Gemini 任务自动化,本周在 S26 Ultra 上推送测试版。实测流程:说"帮我叫一辆去机场的 Uber",Gemini 问完目的地,直接在 Uber App 里填好信息、下单前暂停让你确认。点星巴克时,它翻完菜单选了"馥芮白",还主动帮牛角包勾了加热——判断挺准。

技术上它是在"虚拟窗口"里真实操作 App,不是调 API,是看着界面点按钮,用户全程可以观察或随时接管。

说到这里不得不调侃一下:国内的豆包早就支持"手机操控"了,帮你刷短视频、点外卖不是新鲜事,Google 这个"里程碑"在国内用户看来可能更像是——终于跟上来了?当然,产品成熟度和生态整合是另一回事,但进度确实差了不少。

目前支持的 App 还不多,主要是外卖和出行类,但方向是清楚的。


03 字节跳动的视频 AI 在好莱坞门口踩了刹车

字节跳动的 Seedance 2.0 原本计划全球发布,结果悄悄叫停了。

原因不复杂:好莱坞不满意。这个工具能生成逼真的影视级视频,版权风险一眼就看出来。"够强"不是优点,在版权敏感的市场反而是麻烦所在。

字节跳动面临的处境,和 TikTok 当年在美国有些相似:产品强,但行业摩擦让推进不得不放慢。AI 视频生成能力飞速迭代,对应的版权框架还是一片空白——这次暂停,大概是在等一个谈判窗口,而不只是技术问题。


04 Meta 不想再被英伟达卡脖子了,MTIA 300 悄悄来了

Meta 发布了第三代自研 AI 芯片 MTIA 300,主要干一件事:驱动 Instagram 和 Facebook 的推荐、排名、广告算法——就是决定你刷到什么内容的那套东西。

路线图同步公布:MTIA 400、450、500,后续专注生成式 AI 推理。

逻辑很直接:自研芯片 = 降低对英伟达的依赖 = 更低成本 + 更强议价权。Google 有 TPU,苹果有神经网络引擎,亚马逊有 Trainium,现在 Meta 也补上了这一课。

当然,和英伟达的 CUDA 生态相比差距还不小,软件生态才是真正的护城河。但方向清楚:大厂都在做长线准备,英伟达的统治地位短期内稳,中长期会越来越难。


一张表说清楚这些事

公司 事件 核心看点 影响
Anthropic Claude 支持对话内实时图表 交互式可视化,非侧边栏 交互体验质变,向多模态加速
Google Gemini 任务自动化推送 代劳订 Uber、点星巴克 AI 助手从"问答"到"干活"
字节跳动 Seedance 2.0 全球发布暂停 好莱坞反弹叫停推进 AI 视频行业版权博弈白热化
Meta 发布自研芯片 MTIA 300 推荐系统算力自研,不靠英伟达 大厂算力自主化趋势加速

AI 正在干一件事

把"能聊"变成"能干"。

Claude 开始画图,Gemini 开始跑腿,底层逻辑是一样的——语言模型的界面在扩展,不再只是文本框进、文本框出,而是开始真实地介入你做的事、看到的界面、需要完成的任务。

字节跳动的 Seedance 遇到的麻烦,提醒我们这条路不是平的——监管、版权、行业利益,都是真实的摩擦力。Meta 造自己的芯片,说明大家都在为这场持续很久的游戏做长线准备。

持续关注:Gemini 任务自动化能否快速扩展到更多 App,以及 Claude 的可视化能力在哪些专业领域率先跑出来。


继续阅读

查看全部