
Claude 能"画图"了、Gemini 帮你叫 Uber、字节跳动因好莱坞叫停视频 AI、Meta 悄悄造好了自家 AI 芯片
最近,AI 圈有点忙。
不是那种"某某公司发了个 PPT"的热闹,而是真刀真枪落到产品里的那种更新。Claude 突然学会了"画图"、Gemini 开始帮你点星巴克、字节跳动的视频生成器在好莱坞门口撞了南墙——这几件事放在一起,其实在说同一件事:AI 正在从"能聊天的机器人"变成"真的能干活的东西"。
但这条路走得不那么顺。下面拆开说。
01 Claude 不再只会"说"了,它开始"画图"给你看
Claude 上线了一个低调但挺有意思的更新:图表和图解可以直接嵌在对话里了,不是弹到侧边栏,就在聊天流里,随着你问问题实时更新。
问它"建筑物的重量怎么传递",它不给你一堆文字,而是直接画一张力学图,追问一句图就跟着变。元素周期表的演示里,点击某个元素还会弹出详细数据——更像在用 App,不像在聊天。
和之前的 Artifacts(侧边栏持久化内容)有点区别,这个更随意、更轻——"顺手一画",而不是"专门生成一个文件"。
已向全量用户开放,默认开启,不需要任何设置。

图:AI 正在把数据分析能力直接带进对话——图表不再是附件,而是回答本身
02 Gemini 开始帮你叫 Uber 了,这次是认真的
"AI 帮你订外卖"这件事被吹了好几年。Gemini 这次真的做到了——不过得有一台三星 Galaxy S26 Ultra。
功能叫 Gemini 任务自动化,本周在 S26 Ultra 上推送测试版。实测流程:说"帮我叫一辆去机场的 Uber",Gemini 问完目的地,直接在 Uber App 里填好信息、下单前暂停让你确认。点星巴克时,它翻完菜单选了"馥芮白",还主动帮牛角包勾了加热——判断挺准。
技术上它是在"虚拟窗口"里真实操作 App,不是调 API,是看着界面点按钮,用户全程可以观察或随时接管。
说到这里不得不调侃一下:国内的豆包早就支持"手机操控"了,帮你刷短视频、点外卖不是新鲜事,Google 这个"里程碑"在国内用户看来可能更像是——终于跟上来了?当然,产品成熟度和生态整合是另一回事,但进度确实差了不少。
目前支持的 App 还不多,主要是外卖和出行类,但方向是清楚的。
03 字节跳动的视频 AI 在好莱坞门口踩了刹车
字节跳动的 Seedance 2.0 原本计划全球发布,结果悄悄叫停了。
原因不复杂:好莱坞不满意。这个工具能生成逼真的影视级视频,版权风险一眼就看出来。"够强"不是优点,在版权敏感的市场反而是麻烦所在。
字节跳动面临的处境,和 TikTok 当年在美国有些相似:产品强,但行业摩擦让推进不得不放慢。AI 视频生成能力飞速迭代,对应的版权框架还是一片空白——这次暂停,大概是在等一个谈判窗口,而不只是技术问题。
04 Meta 不想再被英伟达卡脖子了,MTIA 300 悄悄来了
Meta 发布了第三代自研 AI 芯片 MTIA 300,主要干一件事:驱动 Instagram 和 Facebook 的推荐、排名、广告算法——就是决定你刷到什么内容的那套东西。
路线图同步公布:MTIA 400、450、500,后续专注生成式 AI 推理。
逻辑很直接:自研芯片 = 降低对英伟达的依赖 = 更低成本 + 更强议价权。Google 有 TPU,苹果有神经网络引擎,亚马逊有 Trainium,现在 Meta 也补上了这一课。
当然,和英伟达的 CUDA 生态相比差距还不小,软件生态才是真正的护城河。但方向清楚:大厂都在做长线准备,英伟达的统治地位短期内稳,中长期会越来越难。
一张表说清楚这些事
| 公司 | 事件 | 核心看点 | 影响 |
|---|---|---|---|
| Anthropic | Claude 支持对话内实时图表 | 交互式可视化,非侧边栏 | 交互体验质变,向多模态加速 |
| Gemini 任务自动化推送 | 代劳订 Uber、点星巴克 | AI 助手从"问答"到"干活" | |
| 字节跳动 | Seedance 2.0 全球发布暂停 | 好莱坞反弹叫停推进 | AI 视频行业版权博弈白热化 |
| Meta | 发布自研芯片 MTIA 300 | 推荐系统算力自研,不靠英伟达 | 大厂算力自主化趋势加速 |
AI 正在干一件事
把"能聊"变成"能干"。
Claude 开始画图,Gemini 开始跑腿,底层逻辑是一样的——语言模型的界面在扩展,不再只是文本框进、文本框出,而是开始真实地介入你做的事、看到的界面、需要完成的任务。
字节跳动的 Seedance 遇到的麻烦,提醒我们这条路不是平的——监管、版权、行业利益,都是真实的摩擦力。Meta 造自己的芯片,说明大家都在为这场持续很久的游戏做长线准备。
持续关注:Gemini 任务自动化能否快速扩展到更多 App,以及 Claude 的可视化能力在哪些专业领域率先跑出来。