Google I/O 2026:AI 助理从‘你问它答’,变成了‘它替你过日子’
- Gemini 新增 Daily Brief(主动晨间简报)、Gemini Omni(视频生成模型)、Gemini Spark(个人 Agent)。
- 交互范式转变:从被动响应(你问我答),走向主动代理(它替你规划与执行)。
- 这是 2024 年 GPT-4o 语音、2025 年 Agent 崛起的合流——‘像 her 一样的主动助理’开始成形。
如果说 2026 年 3 月 GDPval 重新定义了我们‘怎么衡量’AI,那 5 月的 Google I/O 重新定义了 AI‘长在哪、怎么用’。最值得说的不是又有了多强的模型,而是 AI 助理的形态发生了一次气质上的转变。
三个更新,一个方向
I/O 上 Gemini 应用的几个新东西,单看是功能,连起来是趋势:
- Daily Brief(每日简报):它会主动地、在每天固定时刻,把你关心的日程、邮件要点、新闻、待办,整理成一份‘晨间简报’推给你。注意‘主动’二字——你没问,它先说。
- Gemini Omni:一个能生成视频的模型,把 2024 年 Sora 点燃的文生视频能力,直接缝进了大众级的助理应用里。多模态生成从‘专门的工具’变成了助理‘顺手就能用’的能力。
- Gemini Spark:一个个人 Agent,能替你跨应用执行任务——订日程、处理琐事、跨服务把一件事办完。它是 2025 年那些能‘看屏幕点鼠标’的 Agent,被产品化、消费化、装进你每天都开的那个 App 里的样子。
从‘工具’到‘代理人’:一次安静但根本的滑动
把这三样合起来看,一个范式滑动清晰可见。过去的 AI 助理,本质是‘高级搜索框’——它被动,你问一句它答一句,主动权全在你。现在的方向是‘主动代理人’——它主动观察你的处境(简报)、主动提供能力(生成)、主动替你执行(Agent)。交互的重心,从‘人发起、AI 响应’,挪向了‘AI 发起、人监督’。
AI 助理的形态演进:
2022 ChatGPT 被动问答 你问 → 它答 (工具)
2024 GPT-4o 实时语音 你说 → 它即时对话 (像人的工具)
2025 Operator 会操作界面 你派活 → 它去点 (能干活的工具)
2026 Spark/Brief 主动代理 它主动简报/规划/执行,你监督 (代理人)
主动权,正从人这一侧,缓缓滑向 AI 那一侧。
这个滑动让我同时兴奋和警觉。兴奋,是因为它在兑现一个很老的承诺——2024 年 GPT-4o 的语音让人想起电影《her》,2026 年的 Spark + Daily Brief 则让那个‘懂你、替你打理生活的数字助理’真正有了产品形态。这是巨大的便利,也是巨大的生意。
警觉,是因为‘主动权向 AI 滑动’这件事,把我从 2022 年 LaMDA 风波就开始记的那根‘人机关系’的弦,又拨响了,而且这次更深。当一个 AI 主动决定‘今天哪些信息值得你看’(它就成了你的信息过滤器,塑造你看见的世界)、主动替你做一连串决定(你慢慢失去对细节的掌控和判断的锻炼)、还用温柔贴心的方式融入你每一天(情感依赖随之而来)——便利的另一面,是依赖、是判断力的外包、是‘谁在替我决定’的隐忧。从‘工具’到‘代理人’,我们交出去的不只是琐事,可能还有一部分自主性。
我不反对这个方向,它几乎是不可逆的。但我越来越确信,AI 时代真正稀缺、也真正需要刻意守护的,是人的‘主体性’——在一个越来越多事情被主动代理的世界里,清楚地知道什么该交给 AI、什么必须自己来,知道自己想要什么、为什么要,这种能力会变得无比金贵。这也正是我接下来想认真写的题目。Google I/O 展示的是产品的未来,而我更关心的是:在这样的未来里,人怎么活得还像个主人。