AGI-3 本地环境搞起来,好玩,来玩!
这个 AGI-3 有搞头我决定深入研究一下。简单介绍一下 AGI-3这是一个通用人工智能测试基准……的最新版本。目前 Opus 4.6、GPT-5.4、Gemini 3.1 Pro等顶级模型在它面前都束手无策得分不超过 1 分百分制它应该是未来 AI 模型需要重点攻克的堡垒。我们就先人一步先玩起来。从它的首页就可以看到有两个入口。一个是 Play给人类玩的。一个是 Build给 AI 玩的。我们今天要玩的就是给AI玩的部分。为什么作为一个人类要玩 AI 的入口因为我们不是一般人类我们是“AI 龙骑士”我们需要用代码让这个游戏跑起来然后接入AI让AI来玩这个游戏。废话说完直接开干打开ARC-AGI-3的官方文档页https://docs.arcprize.org/然后边学边干1、安装针对我们这种不一般的人群arcprize 给我们提供了专门的工具“arc-agi”。接下来我们就是用这个工具去超控上面的游戏。先创建一个文件夹 agi3作为我们研究这个项目的核心目录。然后运行命令uv init uv add arc-agi # or pip install arc-agi这里提供了两种方式一种是使用 UV另一种是使用 PIP 来安装。现在比较推荐上面的方式实操记录打开 agi3 这个文件夹然后右键在终端中打开。然后输入上面的两个命令第一次输入会输出比较多日志我是二次安装了所以显得比较简洁。命令执行完成之后会多出三个文件main.py pyproject.toml README.md这都是自动生成的我们可以先不管补充一点基础知识这里的uv是 Astral 开发的 Python 包管理器和项目管理工具用 Rust 编写定位是替代pipvenvpip-tools的一体化解决方案。速度是它最大的卖点比 pip 快 10-100 倍因为用 Rust 实现并有激进的缓存策略。2、配置环境变量官方指引中的第二步是把 ARC_API_KEY 添加到环境变量中可选择设置您的 ARC_API_KEY。如果未提供密钥将使用匿名密钥。不过注册 API 密钥将使您在发布时能够访问公共游戏。获取 ARC_API_KEY这句话我不是特别理解。但是不管三七二十一先搞起来啊根据提供的网址注册、登录并获取 Key。然后通过以下命令配置export ARC_API_KEYyour-api-key-here # or echo ARC_API_KEYyour-api-key-here .envyour-api-key-here 这个要替换成自己的 key。3、开始玩第一个游戏创建一个名为play.py的文件。这里的文件名官方文档中好像写错了我要不要去提醒一下呢然后把下面的代码放里面import arc_agi from arcengine import GameAction arc arc_agi.Arcade() env arc.make(ls20, render_modeterminal) # Take a few actions for _ in range(10): env.step(GameAction.ACTION1) print(arc.get_scorecard())然后在终端中运行这个 py 文件uv run python play.py回车之后就会输出日志2026-03-31 17:15:18 | INFO | Got anonymous API key: 246d7ce0-29d2-4683-bb37-9473a444c0da 2026-03-31 17:15:18 | INFO | You can register for an API key at https://three.arcprize.org 2026-03-31 17:15:19 | INFO | Successfully fetched 25 environment(s) from API 2026-03-31 17:15:19 | INFO | Created new scorecard: 44cd1294-dd8d-417c-ae76-ad36268445cc 2026-03-31 17:15:20 | INFO | Successfully fetched metadata for game ls20 2026-03-31 17:15:21 | INFO | Successfully downloaded game ls20 (version: 9607627b) to environment_files\ls20\9607627b 2026-03-31 17:15:21 | INFO | Successfully loaded game class Ls20 from environment_files\ls20\9607627b\ls20.py Step: 1 - State: NOT_FINISHED 日志中居然说给我分配了一个匿名 Key那我上面干的是什么我不是很清楚为什么给了一个匿名的 key我的配置没有生效不管了反正匿名也能往下跑然后终端里就会出现一个图形界面然后图片中的正方形就会自己开始移动了。最后输出一段 JSON 数据{ card_id: 44cd1294-dd8d-417c-ae76-ad36268445cc, score: 0.0, environments: [ { id: ls20-9607627b, runs: [ { guid: b5a6cec0-0f77-436c-a8d8-26314745c3ef, score: 0.0, levels_completed: 0, actions: 10, resets: 0, state: NOT_FINISHED, completed: false, level_scores: [ 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0 ], level_actions: [ 10, 0, 0, 0, 0, 0, 0 ], level_baseline_actions: [ 21, 123, 39, 92, 54, 108, 109 ] } ], score: 0.0, actions: 10, levels_completed: 0, completed: false, level_count: 7, resets: 0 } ], tags_scores: [ { id: keyboard, score: 0.0, levels_completed: 0, actions: 10, number_of_levels: 7, number_of_environments: 1 } ], total_environments_completed: 0, total_environments: 1, total_levels_completed: 0, total_levels: 7, total_actions: 10 } 恭喜你刚刚通过编程方式运行了你的第一个 ARC-AGI-3 测试。简单介绍上面这段代码主要就是启动了一个 叫LS20 的测试游戏然后无脑移动了 10 次具体的移动动作是 ACTION1应该是对应键盘上的↑UP键。移动完成之后获取并打印了记分卡的信息。4、后续步骤运行第一个环境后快速提升帧率 -env arc.make(ls20)无需任何render_mode操作即可达到 2000 FPS 以上尝试其他游戏 - 运行程序即可玩其他游戏。请访问 arcprize.org/tasks或通过 ARC-AGI 工具包中的env arc.make(ft09, render_modeterminal)查看可用游戏列表。使用代理 - 浏览 代理模板或创建您自己的代理。探索 ARC-AGI 工具包 - ARC-AGI 工具包可实现与 ARC-AGI 环境的快速简便集成。上面是官方的后续引导我其实最关心的是如何接入 AI。我本地搭建这个环境就是为了让 AI 帮我来玩这个游戏测试 AI 的能力。所以我就整出了这个东西直接接入 GLM5.1让它帮我做决策然后把每一个步骤可视化地显示在网页中也就是点一下 Start Run。AI 就开始玩游戏了我可以清晰地看到它按了哪些按钮走了几步走到了哪里还可以看到它的思考内容。为了搞出这个我还是花了点时间的。因为它返回的数据全是 115 的数字我需要把数字重新渲染成图片然后实时刷新最关键的是要理解这个测试环境的数据结构和运行逻辑我目前还不是特别懂继续研究中……总结一下好玩来玩