谷歌把AI塞进安卓底层：手机不再让你自己点App，它直接帮你跑腿

张

张建站

2026/5/15 21:41:03

10分钟阅读

出品 | 网易智能作者 | 辰辰编辑 | 王凤枝手机不再等你一个个点开App它开始替你跑腿了。在刚刚结束的谷歌Android ShowI/O Edition上谷歌把Android的下一步说得很清楚它不想再只做一个运行App的底座而是要变成一套能理解意图、调用应用、替用户完成任务的智能系统。这次发布会的核心是Gemini Intelligence。过去两年手机里的AI大多还是一个聊天入口。你问它问题它给你答案你让它总结网页它帮你提炼几句话。但从今年夏天开始谷歌想把Gemini塞进安卓系统的更深处让它从回答问题进入执行任务。比如你在Gmail里收到一份课程大纲它可以读出里面的书单跳到购物App把书放进购物车你看到酒店大堂的一张旅游折页拍照后让它去Expedia找适合6人的同款旅行团你想预约医生、填写表格、整理一段语音碎碎念它也能在Chrome、Gboard和第三方App之间自动接力。这才是谷歌这次想证明的事真正的AI手机不是桌面上多了一个聊天机器人而是AI开始沉到系统底层替你看屏幕、懂意图、跨App办事。换句话说手机正在从你自己点变成它替你办。01—跨越聊天机器人阶段安卓的特工化长期以来我们对手机AI的认知大多停留在问答层面。你问它天气它告诉你温度你让它订闹钟它定个时间。但在本次Android Show上谷歌安卓生态负责人萨米尔·萨马特(Sameer Samat)抛出了一个极具野心的论断我们正在从操作系统转向智能系统。这意味着Gemini不再只是一个躲在搜索框背后的助理而是一个能够跨应用执行任务的智能体。自动化的多步连招发布会重点展示了Gemini Intelligence在多步任务处理上的能力。这种能力不再局限于谷歌自家的全家桶而是深入到了第三方App中。· 场景A 你在Gmail里收到了一份课程大纲。过去你需要手动复制书名打开购物App搜索再加入购物车。现在你只需要召唤Gemini它能自动读取大纲里的书单并直接在电商平台上把所有书放进购物车等你最后点一下确认。· 场景B 想报个动感单车课Gemini可以直接进入健身App帮你抢下前排的座位。· 场景C 看到酒店大堂的一份旅游折页觉得不错随手拍张照对Gemini说帮我在Expedia上找一个适合6人的同款旅行团。然后你就可以关掉屏幕该干嘛干嘛了Gemini会在后台工作并通过实时通知告诉你进度。屏幕感知成为核心交互这种代理能力之所以强大是因为Gemini具备了深度的视觉上下文理解。当你长按电源键召唤Gemini时它不仅仅是听你说话还在看你的屏幕。如果你正在备忘录里写一份长长的购物清单你只需说一句帮我把这些全订了它就能识别列表内容自动跳转到外卖或生鲜平台完成下单流程。谷歌强调Gemini在执行这些任务时能确保人在回路(Human in the loop)。它会处理繁琐的逻辑但在最后付钱或完成交易的前一秒它一定会跳出来请求你的最终确认。这既是为了安全也是为了缓解用户对AI乱花钱的焦虑。02—浏览器与输入的细节革命除了那些宏大的自动化叙事谷歌这次在Chrome和键盘(Gboard)这两个最高频的场景上也下了大功夫。让天下没有难填的表格移动端填表是所有人的噩梦屏幕小、输入框多、还要反复切换App去查信息。谷歌推出的个人智能(Personal Intelligence)试图终结这个痛点。在用户明确授权的前提下Gemini会从你连接的各个App中提取相关信息帮你一键填好复杂的表格。不管是新App的注册还是政务、差旅表格Gemini都能精准地把对应信息塞进那一个个微小的文本框里。此外Chrome浏览器也迎来了Auto Browse功能。从6月下旬开始安卓版的Chrome不仅能帮你总结网页内容还能直接帮你在网页上预约医生或预订停车位。Rambler懂人话的输入法我们说话时总会有各种嗯、啊、那个或者说错话又立刻纠正。传统的语音转文字往往会把这些废话原封不动地录进去导致发出的消息一团糟。Gboard新推出的Rambler功能就是为了解决这个问题。你可以随心所欲地、甚至语无伦次地对着手机说一段话Rambler会实时理解你的真实意图去掉赘语把你的碎碎念润色成一段逻辑清晰、表达得体的文字。更绝的是Rambler支持实时多语言混输。比如你在说中文时突然夹杂几个英文术语或小众的方言词汇它都能精准捕捉并保持语境的一致性。这种对全球化交流习惯的洞察确实体现了谷歌在多模态大模型上的功力。03—自建小组件UI的生成式飞跃发布会上最让极客们兴奋的莫过于Create My Widget(创建我的小组件)。安卓一直以高度自定义著称但传统的Widget(小组件)是由开发者预定义的。现在谷歌把这个能力交到了用户手里。你只需要用自然语言描述你的需求。比如我是一个健身达人帮我做一个每周推荐三道高蛋白食谱的小组件。或者我只关心风速和降雨帮我做一个极简的天气插件。Gemini会根据你的描述直接构建并生成对应的UI界面。配合Material 3 Expressive设计语言生成的UI不仅功能实用动画效果也更灵动旨在减少干扰让用户更专注于任务本身。04—生态全家桶从Googlebook到全场景覆盖如果说AI是安卓系统的灵魂进化那这次发布会上谷歌还展示了另一面如何把这个灵魂装进硬件、塞进汽车、铺到整条生态链上。Googlebook亮相AI笔记本的安卓化这次发布会上谷歌联合宏碁、华硕、戴尔、惠普及联想等巨头正式推出了全新的笔记本产品线Googlebook。这些电脑将配备内置Gemini的魔力光标(Magic Pointer)并支持与安卓手机深度联动直接在电脑上运行手机App。笔记本端同样支持自建小组件让个人助理实现跨设备接力。Android Auto不仅能导航还能点外卖车载系统Android Auto也迎来了一次大幅更新核心逻辑是去工具化生活化。今年晚些时候宝马、福特、现代等主流品牌的车主将能在车辆停驶时以60fps全高清画质观看YouTube视频。YouTube Music和Spotify的界面也经过了重新设计。通过集成的Gemini车主可以在开车时动动嘴就在DoorDash上订好晚餐。谷歌还添加了视觉自适应功能无论你的车机屏幕是带鱼屏、圆形还是异形屏系统都能实现满格显示并支持在导航时并排显示自定义小组件。拆墙行动更开放的互传与换机谷歌还在用前所未有的开放姿态试图打破苹果的围墙花园。去年谷歌让Pixel能与iPhone互传文件今年Quick Share功能扩展到了三星、OPPO、一加、vivo、小米和荣耀等品牌。即便对方设备不兼容也能通过二维码和云端实现秒传甚至在WhatsApp内部就能直接调用。全新的iOS-to-Android迁移工具不仅能导照片和联系人连eSIM、主屏幕布局和已安装App的对应安卓版本都能一并迁移极大降低了果粉转投安卓的心理门槛。创作者的效率利器针对TikTok和Reels时代的创作者安卓推出了Screen Reactions(屏幕反应)功能可以同时录制你的脸和屏幕操作。此外谷歌与Meta深度合作为安卓端Instagram带来了原生的Ultra HDR、防抖及夜景模式确保发出的图片不再被压缩得糊一脸。数字化关怀与防盗黑科技为了治好手机沉迷安卓引入了一个极具压迫感的功能Pause Point(冷静期)。当你试图打开容易让你分心的App时系统会强制你停顿10秒并引导你去读读Google Play Books里的书。此前在巴西测试的防盗保护现已全球推行。在全新的Android 17设备上远程锁定(Remote Lock)和盗窃检测锁定将默认开启。即便PIN码被猜中AI也会自动拉长重试等待时间。甚至警察都能在锁屏界面直接读取设备的IMEI码快速确认手机归属权。另外值得一提的是谷歌还给那4000多个安卓表情符号做了3D渲染让它们不再扁平看起来更真实、更有感染力。05—战略博弈谷歌抢在苹果AI重启前的闪电战在媒体眼中这次Android Show不只是一场技术发布会更像是一场精心策划的卡位战。距离苹果在WWDC上展示新版Apple Intelligence仅剩几周谷歌显然想抢先定义AI手机的标准。从操作系统到智能系统CNBC在报道中敏锐地指出谷歌正在将Gemini从一个单纯的聊天机器人提升为安卓设备的运营层。谷歌安卓生态负责人萨马特在接受CNBC采访时说我们正在从操作系统转向智能系统。这句话的意思很明确安卓不再只是一个让用户点击图标、运行App的平台而是要变成一个能感知屏幕、跨应用操作的智能中枢。这种转型背后其实是一场微妙的卡位。就在四个月前苹果才刚宣布与谷歌达成Gemini合作协议转头到了自家主场谷歌就给这位盟友来了一记重压。长期以来苹果把隐私、硬件整合和交互控制权当作护城河而谷歌这次要证明的是深度接管设备体验的同时安卓同样能把控制权稳妥地交还给用户。而且相比OpenAI的ChatGPT或Anthropic的Claude谷歌最大的优势就在于系统级的整合。正如技术博主萨迪普·斯里瓦斯塔瓦(Sudeep Srivastava)所说Gemini Intelligence绝不是一个简单的聊天机器人更新它是对操作系统的全面接管。它不再是一个你打开的App而是深埋在一切之下的基础设施。另一名X用户也认为当下手机端AI的竞争已经转向了平台控制。斯里瓦斯塔瓦还提到当下微软的Copilot主要活跃在Office生态里Apple Intelligence目前更侧重于单应用内的提升而谷歌正在把Gemini变成30亿安卓设备的神经系统。核心竞争力的差异化不只是帮工更是特工Android Authority的评论认为这是谷歌迄今为止将Gemini转化为真正安卓助手的最大一次努力。以往的Gemini往往只是回答问题甚至有时给出的答案还不够理想。但这次展示的Gemini Intelligence表现出了明显的智能体特征它能感知你是谁、你需要做什么并具备直接上手搞定任务的能力。这种能力不局限于谷歌自家应用还通过Chrome扩展到了整个Web端。如果一个任务能在网页上完成Gemini就会想办法帮你实现自动化。氛围编程与UI的新玩法TechCrunch则关注到了一个非常前卫的细节氛围编程(Vibe Coding)。虽然Nothing等硬件初创公司去年也尝试过类似工具但谷歌将这种通过自然语言描述来构建小组件的能力直接集成进了系统。TechCrunch评论称这让用户第一次体验到了自建UI的快感你不需要懂代码只要说出你的需求(比如健身食谱或特定气象指标)系统就能帮你生成一个功能完备的小组件。资本市场的看好与隐私忧虑CNBC提到华尔街对谷歌的AI战略表现出了极大的热情。报道强调过去一年里Alphabet的股价涨幅高达140%远超苹果的40%。投资者迫切想看到Gemini如何渗透进30亿安卓用户的日常生活。然而虽然萨马特强调了人在回路和必须确认的原则但外界依然担心AI在后台拥有的操作权限。各家报道的共识是谷歌正试图证明自己在AI手机领域走得最远。但正如Android Authority所说这可能是安卓用户期待已久的底层升级不过这种智能系统的转型能否真正消除用户与任务之间的摩擦还要看实际落地后的表现。06—社交媒体上的赞美、质疑与焦虑每当科技巨头抛出宏大蓝图用户的反馈总是最真实的镜子。在Reddit和X上评论呈现出明显的两极分化。派别一拥抱未来的Pixel粉不少用户被多步自动化和Rambler圈粉。有网友在社交媒体上激动地表示全新的设计、多级自动化、Rambler语音转文字……伙计这真的让我太想买一台Pixel了更有资深安卓用户感叹像自动填表(Autofill)这类功能简直是终于等到你谢天谢地认为这些升级才是真正能解决日常琐事的干货。派别二UI与命名的毒舌党由于Gemini Intelligence这个名字和苹果过于接近不少网友开启了吐槽模式UI看起来很华丽但是这个名字……Gemini Intelligence真的需要抄袭苹果对吧也有用户对UI的实际表现持保留态度认为演示中的Material Expressive看起来很美但实际用起来未必那么丝滑。派别三深感焦虑的实用主义者这部分声音主要集中在Android Auto(车载系统)上。一位Reddit网友用长帖吐槽目前Gemini在车机上的体验极其糟糕Gemini比原来的谷歌助理更慢、话更多、错误率更高。对于司机来说我们要的是简单直接而不是一个话痨AI。此外隐私和功耗也是绕不开的话题。虽然谷歌一再强调隐私透明度看板和第三方安全审计但把所有App数据、邮件内容都交给AI去读依然让不少人感到不安。还有用户担心老机型的适配问题。毕竟像多步自动化这样吃算力的功能大概率只会出现在最新旗舰上老款Pixel或低端机型恐怕只能干看着。07—结语安卓的成人礼从2008年第一台安卓手机面世到现在安卓从简陋走到精致从封闭走向开放。但过去十几年它的核心逻辑始终没变人去找AppApp提供服务。Gemini Intelligence的出现意味着安卓开始尝试翻过这一页。以后你用手机也许不再需要想该打开哪个App只需要说出你想做什么。手机不再只是工具箱而是一个能替你跑腿的助手。当然蓝图再宏伟落地才算数。AI智能体的准确率、第三方App的适配深度以及在车载等复杂场景下的稳定表现都是谷歌必须啃下的硬骨头。这场关于智能系统的战争才刚刚打响。谷歌已经先出了牌接下来就看苹果在几周后的WWDC上怎么接了。—— END ——排版 | 张若蘅审核 | 北辰社群推荐—重塑 AGI 智能思维同步 AI 领域前沿认知。欢迎扫描下方二维码链接每位智能时代先行者。▲扫码加入粉丝群▲视频推荐—文章推荐—