目录背景尴尬Mac数据几乎为零工具怎么用说到底还是数据看到一篇AI的研究文章提到AI不认识Mac觉得很有意思分享一下里面的工具看来要搞个Mac以后玩一玩。首先声明我几乎不用Mac主要感觉还是性价比不高平时也没时间陪她玩。背景过去一年computer-use AI从哇好酷变成了哇好用。Gartner预测到2026年底40%的企业应用会内置AI Agent——去年这个数字还不到5%。换句话说这个赛道已经不是未来可期是未来已来。但问题来了。尴尬Mac数据几乎为零AI学用电脑靠的是看——看截图、看界面元素、看操作流。训练数据越多样AI就越聪明。然而目前公开的研究数据集几乎全是Windows和Android的。我们扒了一下OS-ATLAS——业界最大的开源GUI数据集之一1300万个界面元素——你猜macOS占多少0.06%。没打错。一万个样本里六个是Mac的。原因也不复杂macOS的接口不像Windows和Android那样好抓。苹果的辅助功能API虽然强大但要大规模采集需要懂行的人写专门的工具。而这种工具之前根本不存在。于是结果就是全行业拿着几乎没有Mac数据的语料训练出了一堆Windows很熟、Mac一脸懵的AI Agent。工具GUIrilla就是这个工具。开源了三样东西名字干嘛的一句话总结GUIrilla 框架自动安装Mac应用、逐屏探索、生成界面图谱不需要人AI自己把App看一遍GUIrilla-Task 数据集27,171个任务覆盖1,108个Mac应用目前最大的公开Mac交互数据集没有之一macapptree 库一个Python小工具提取任何Mac App的界面结构不懂Mac开发也能用三行代码拿到界面树备注论文在arXiv数据在Hugging Face代码在GitHub。怎么用如果你在训练电脑AI Agent→ GUIrilla-Task直接加进你的训练 pipeline补上Mac这块短板。如果你在做UI理解benchmark→ 数据集自带截图结构化数据视觉模型和结构模型都能跑。如果你只是想程序化地读懂一个Mac App→ macapptree最轻量的选择没有之一。说到底还是数据AI在Mac上表现差不是模型的问题是数据的问题。模型再强没见过Mac的界面它也猜不对那个按钮在哪。而模型用什么数据取决于开源社区提供什么数据。我们正在经历的所谓Software 3.0——AI替你操作电脑而不只是跟你聊天——这件事要在Mac上跑通首先得有人把Mac的数据补上。GUIrilla、GUIrilla-Task、macapptree就是我们的答案。希望对你也有用。