智能购物车与视频模型时代：Google I/O 2026 上的 AI 智能体如何重塑购物与内容创作

04:41, 23 五月

长期以来，我们与人工智能的交互主要局限于对话框。我们提出问题，系统生成答案。然而，在刚刚结束的 Google I/O 2026 大会上，这家科技巨头明确展示了简单聊天机器人时代的终结。取而代之的是功能完备的 AI 智能体，它们能够承担现实世界中的各种琐碎任务。

本次发布会的核心技术突破是 Gemini Omni 系列模型。这不仅仅是文本引擎的升级。开发者将 Omni 称为“世界模型”（world model），其核心特性在于对物理规律、上下文语境的深刻理解以及交互式多模态能力。在实际应用中，这意味着用户可以利用智能手机拍摄的任何视频，通过简单的语音指令彻底重写场景：无论是改变天气、更换背景、调整视角，还是添加新角色。该系列的首批工具 Omni Flash 将于今年夏天在 YouTube Shorts 和 Gemini 应用中上线。

与此同时，谷歌正在为所谓的“智能体商业”奠定基础。你是否注意到，在不同商家的数十个标签页之间切换对比，常让在线购物变得精疲力竭？“通用购物车”（Universal Cart）统一生态系统正是为了解决这一痛点而生。

现在，来自搜索、Gmail 或 YouTube 的商品都可以汇集到一个智能购物车中。神经网络会在后台自动追踪价格波动，通过 Google Wallet 寻找隐藏优惠，甚至检查产品的兼容性。想象一下你在组装电脑：如果选定的处理器与主板不匹配，AI 会自动发出提醒，并提供来自其他零售商的替代方案。只需通过 Google Pay 点击一次，即可完成对不同商店所有商品的统一结算。

将财务权限委托给算法是否会引发安全担忧？答案是肯定的。为此，谷歌推出了“智能体支付协议”（AP2）。该协议创建了加密的数字授权并设定了严格的支出上限。例如，全新的后台助手 Gemini Spark 可以帮你预订餐厅或处理外卖配送，但最终的资金扣除仍需经过人工验证。

AI 的集成也正在走出屏幕。到今年年底，该生态系统将与可穿戴设备紧密结合，其中包括新发布的基于 Android XR 的智能眼镜。展望未来，这将构建一个无缝的数字环境，技术开始预判我们的任务场景，从而让我们从繁琐的点击操作中解脱出来。

Gemini Omni