Plan-and-Execute：先规划再执行

张

张建站

2026/6/12 4:20:24

10分钟阅读

一只用 AI Agent 搭副业产线的程序员ReAct 的优点是灵活——走一步看一步。但缺点也很明显没有全局视角。它在第 3 步做的事可能和第 8 步做的事重复了。它发现了新信息后可能要走回头路。Plan-and-Execute 是另一种思路先生成完整计划再一次性执行。如果你把 ReAct 比作「边走边问路」Plan-and-Execute 就是「先看地图确定路线再出发」。两种模式对比举个例子任务是「把 Go 1.21 项目升级到 1.23确保所有依赖兼容」。ReAct 的做法边走边想Step 1: 读取 go.mod → 看到 1.21 和一堆依赖 Step 2: 改 go.mod 版本号 → 1.21 → 1.23 Step 3: go mod tidy → 报错某个依赖不兼容 Step 4: 查这个依赖的最新版本 → 查到了 Step 5: 更新依赖 → 又报错另一个间接依赖冲突 Step 6: ...在迷宫里面撞墙Plan-and-Execute 的做法先规划再执行规划阶段 1. 读取 go.mod列出所有直接依赖 2. 逐一检查每个依赖是否兼容 Go 1.23 3. 对不兼容的依赖找到兼容版本 4. 更新 go.mod 中的版本号 5. 更新不兼容的依赖版本 6. 执行 go mod tidy 7. 编译验证 8. 运行测试执行阶段按顺序执行 1→2→3→...→8Plan-and-Execute 把任务变成了一个有向无环图DAG——每个步骤有明确的依赖关系执行引擎按拓扑顺序跑。实现一个轻量级的 DAG 执行器packagemainimport(contextfmtsynctime)// Task 单个任务节点typeTaskstruct{IDstringjson:idNamestringjson:nameDescriptionstringjson:descriptionDependsOn[]stringjson:depends_on// 依赖的任务 ID 列表Actionstringjson:action// 要执行的操作指令}// Plan LLM 生成的执行计划typePlanstruct{Goalstringjson:goalTasks[]Taskjson:tasks}// TaskResult 任务执行结果typeTaskResultstruct{TaskIDstringOutputstringErrorerror}// DAGExecutor DAG 执行器typeDAGExecutorstruct{executorfunc(ctx context.Context,task Task)(string,error)}funcNewDAGExecutor(executorfunc(ctx context.Context,task Task)(string,error))*DAGExecutor{returnDAGExecutor{executor:executor}}// Execute 按拓扑顺序执行计划func(e*DAGExecutor)Execute(ctx context.Context,plan Plan)(map[string]TaskResult,error){// 构建依赖图inDegree:make(map[string]int)dependents:make(map[string][]string)// 谁依赖我taskMap:make(map[string]Task)for_,t:rangeplan.Tasks{taskMap[t.ID]t inDegree[t.ID]len(t.DependsOn)for_,dep:ranget.DependsOn{dependents[dep]append(dependents[dep],t.ID)}}// 验证检查所有依赖是否存在for_,t:rangeplan.Tasks{for_,dep:ranget.DependsOn{if_,ok:taskMap[dep];!ok{returnnil,fmt.Errorf(任务 %s 依赖了不存在的任务 %s,t.ID,dep)}}}// 检测循环依赖ifcycle:detectCycle(taskMap);cycle!nil{returnnil,fmt.Errorf(检测到循环依赖: %v,cycle)}results:make(map[string]TaskResult)varmu sync.Mutex// 找到所有入度为 0 的节点没有依赖可以直接执行ready:make(chanTask,len(plan.Tasks))for_,t:rangeplan.Tasks{ifinDegree[t.ID]0{ready-t}}varwg sync.WaitGroup errCh:make(chanerror,len(plan.Tasks))// 并发执行for{select{casetask:-ready:wg.Add(1)gofunc(t Task){deferwg.Done()fmt.Printf(▶ 执行: [%s] %s\n,t.ID,t.Name)output,err:e.executor(ctx,t)mu.Lock()results[t.ID]TaskResult{TaskID:t.ID,Output:output,Error:err}mu.Unlock()iferr!nil{fmt.Printf(❌ [%s] 失败: %v\n,t.ID,err)errCh-fmt.Errorf(任务 %s 失败: %w,t.ID,err)return}fmt.Printf(✅ [%s] 完成: %s\n,t.ID,truncate(output,80))// 通知依赖此任务的其他任务for_,dependent:rangedependents[t.ID]{mu.Lock()inDegree[dependent]--ifinDegree[dependent]0{ready-taskMap[dependent]}mu.Unlock()}}(task)default:// 没有就绪的任务了等待完成wg.Wait()// 检查是否有错误select{caseerr:-errCh:returnresults,errdefault:// 检查是否有未完成的任务死锁mu.Lock()remaining:0for_,d:rangeinDegree{ifd0{remaining}}mu.Unlock()ifremaining0{returnresults,fmt.Errorf(执行完成但 %d 个任务未执行可能存在依赖问题,remaining)}returnresults,nil}}}}// detectCycle 检测 DAG 中是否有环funcdetectCycle(tasksmap[string]Task)[]string{visited:make(map[string]bool)recStack:make(map[string]bool)varcycle[]stringvardfsfunc(idstring)booldfsfunc(idstring)bool{visited[id]truerecStack[id]truefor_,dep:rangetasks[id].DependsOn{if!visited[dep]{ifdfs(dep){cycleappend(cycle,id)returntrue}}elseifrecStack[dep]{cycleappend(cycle,dep,id)returntrue}}recStack[id]falsereturnfalse}forid:rangetasks{if!visited[id]{ifdfs(id){returncycle}}}returnnil}functruncate(sstring,nint)string{iflen(s)n{returns[:n]...}returns}// ──────────── 两阶段实现规划执行 ────────────typePlanAndExecuteAgentstruct{plannerfunc(goalstring)(Plan,error)// 调用 LLM 生成计划executor*DAGExecutor}func(a*PlanAndExecuteAgent)Run(ctx context.Context,goalstring)(map[string]TaskResult,error){// 阶段 1规划fmt.Println( 规划阶段生成执行计划...)plan,err:a.planner(goal)iferr!nil{returnnil,fmt.Errorf(规划阶段失败: %w,err)}fmt.Printf(生成了 %d 个任务:\n,len(plan.Tasks))for_,t:rangeplan.Tasks{fmt.Printf( [%s] %s (依赖: %v)\n,t.ID,t.Name,t.DependsOn)}// 阶段 2执行fmt.Println(\n⚡ 执行阶段按拓扑顺序运行...)returna.executor.Execute(ctx,plan)}// ──────────── 示例Go 项目升级计划 ────────────funcmain(){// 模拟 LLM 规划器mockPlanner:func(goalstring)(Plan,error){returnPlan{Goal:goal,Tasks:[]Task{{ID:1,Name:读取 go.mod,Description:获取当前版本和依赖,DependsOn:[]string{},Action:read go.mod},{ID:2,Name:列出直接依赖,Description:解析所有直接依赖,DependsOn:[]string{1},Action:list direct deps from go.mod},{ID:3,Name:逐检查依赖兼容性,Description:对每依赖检查 Go 1.23 兼容,DependsOn:[]string{2},Action:check each dep for Go 1.23},{ID:4,Name:找到不兼容依赖的新版本,Description:对不兼容的依赖查询可用版本,DependsOn:[]string{3},Action:find compatible versions},{ID:5,Name:更新 go.mod 版本号,Description:将 go 1.21 改为 go 1.23,DependsOn:[]string{1},Action:update go version in go.mod},{ID:6,Name:更新依赖版本,Description:更新不兼容的依赖到兼容版本,DependsOn:[]string{4,5},Action:update dep versions},{ID:7,Name:执行 go mod tidy,Description:清理和下载依赖,DependsOn:[]string{6},Action:go mod tidy},{ID:8,Name:编译验证,Description:确保项目能编译通过,DependsOn:[]string{7},Action:go build ./...},{ID:9,Name:运行测试,Description:确保所有测试通过,DependsOn:[]string{8},Action:go test ./...},},},nil}// 模拟执行器 - 实际项目这里接真正的 LLM 调用和工具执行mockExecutor:func(ctx context.Context,t Task)(string,error){time.Sleep(100*time.Millisecond)// 模拟执行时间returnfmt.Sprintf([%s] 成功: 已完成 %s,t.ID,t.Action),nil}dagExec:NewDAGExecutor(mockExecutor)agent:PlanAndExecuteAgent{planner:mockPlanner,executor:dagExec,}results,err:agent.Run(context.Background(),将 Go 项目从 1.21 升级到 1.23确保所有依赖兼容)iferr!nil{fmt.Printf(❌ 执行失败: %v\n,err)return}fmt.Printf(\n✅ 全部完成 (%d 个任务)\n,len(results))forid,r:rangeresults{fmt.Printf( [%s] %s\n,id,r.Output)}}DAG 执行器的核心逻辑// 1. 拓扑排序入度为 0 的任务先执行for_,t:rangetasks{iflen(t.DependsOn)0{ready-t// 没有依赖立即执行}}// 2. 当任务完成时通知依赖它的人for_,dependent:rangedependents[task.ID]{inDegree[dependent]--ifinDegree[dependent]0{ready-dependent// 所有依赖都完成了可以执行}}这就是大学数据结构的拓扑排序——当年学的时候觉得没用现在成了 Agent 执行引擎的核心。Plan-and-Execute vs ReAct选哪个维度ReActPlan-and-Execute规划逐步推理走一步看一步一次性生成完整计划灵活性高随时根据观察调整低计划生成后较难更改效率可能有重复步骤去重后执行效率更高并发不能并发步骤串行无依赖的任务可并发执行Token 消耗每步都要推理规划阶段大执行阶段小失败恢复自然重试需要重新规划或跳过失败节点适用场景探索性任务、Bug 排查步骤明确的任务、批处理实战判断标准如果任务步骤可以事前预测 80% 以上 → Plan-and-Execute如果任务路径高度依赖中间结果 → ReAct你也可以组合使用用 Plan-and-Execute 做整体框架每个 Task 内部用 ReAct 做微小决策。一个真实的坑计划太细我用 Plan-and-Execute 跑过一次代码迁移任务LLM 生成的计划有 47 个步骤。其中 13 个步骤是多余的——比如「检查 go.sum 文件存在性」「确认 go 命令可用」这种应该在环境检查阶段统一做的事。教训在给 LLM 的规划 Prompt 里加上「选择合适的粒度不要列出环境检查或者可以通过自动化工具一步完成的步骤」。计划不是越细越好。总结ReAct 和 Plan-and-Execute 是 Agent 设计的两大范式。实战中的 Agent 往往两者都用——Plan-and-Execute 给骨架ReAct 填血肉。下一篇我们跳出单个 Agent看一个更高维度的问题什么时候该把任务拆给多个 Agent 并行做关注我别错过。一只用 AI Agent 搭副业产线的程序员全平台同名虾哥不加班需要定制 AI 工具来聊聊 → lob_ai源码GitHub - lobster-bujiaban

【Rust】19-FFI、ABI 与跨语言边界设计

FFI、ABI 与跨语言边界设计研究目标理解 FFI 不只是语法互调，还包含 ABI、所有权和错误边界。掌握 Rust 与 C 交互时的基础表示和安全约束。学会设计清晰的跨语言 API 边界。 FFI 与 ABI FFI 是 foreign function interface，指不同语言之间互相调用。A…...

2026/6/12 4:18:25 阅读更多 →

探索Mermaid Live Editor：3步解决技术图表创建难题

探索Mermaid Live Editor：3步解决技术图表创建难题【免费下载链接】mermaid-live-editor Edit, preview and share mermaid charts/diagrams. New implementation of the live editor. 项目地址: https://gitcode.com/GitHub_Trending/me/mermaid-live-editor …...

2026/6/12 4:18:19 阅读更多 →

VS2010下MFC对话框一键导出ListCtrl数据到Excel（含完整COM封装类）

本文还有配套的精品资源，点击获取简介：这个资源包提供一个开箱即用的Visual Studio 2010 MFC对话框工程，点击按钮即可把ListCtrl控件中所有行、列的文本内容完整导出为Excel文件。底层通过Windows原生COM接口调用Excel应用程序&#xff0…...

2026/6/12 4:17:45 阅读更多 →

CSDN AI分发撤回黄金15分钟法则：超时即不可逆！3类高危场景+2套应急回滚SOP（含工单提报话术模板）

更多请点击： https://kaifayun.com 第一章：CSDN AI 数字营销分发后的文章可以单独撤回某一个平台吗？ CSDN AI 数字营销平台在执行“一键多平台分发”时，会将同一份内容同步发布至 CSDN 博客、知乎、微信公众号（需授权…...

2026/6/12 3:05:44 阅读更多 →

OpenRocket：零基础掌握专业火箭设计与飞行仿真

OpenRocket：零基础掌握专业火箭设计与飞行仿真【免费下载链接】openrocket Model-rocketry aerodynamics and trajectory simulation software 项目地址: https://gitcode.com/GitHub_Trending/op/openrocket OpenRocket是一款功能强大的开源火箭设计与仿真…...

2026/6/10 18:58:26 阅读更多 →

请做coser的主人9下载2026官方正版

下载链接浅析全动态真人互动影像作品的工业化管线与设计逻辑：以《请做coser的主人9》为例近年来，随着硬件渲染能力的提升和流媒体解码技术的普及，全动态真人互动影像（Full Motion Video, 简称FMV）迎来了一波高频更…...

2026/6/11 12:17:19 阅读更多 →

深度解析移动端免Root系统提取工具：Payload-Dumper-Android技术架构与实现原理

深度解析移动端免Root系统提取工具：Payload-Dumper-Android技术架构与实现原理【免费下载链接】Payload-Dumper-Android Payload Dumper App for Android. Extract boot.img or any other partitions (images) from OTA.zip or payload.bin without PC 项目地址:…...

2026/6/10 14:38:37 阅读更多 →