FunSearch太烧钱？试试这个千次查询就能搞定TSP的LLM自动算法设计新框架

张

张建站

2026/7/28 21:18:38

10分钟阅读

FunSearch太烧钱？试试这个千次查询就能搞定TSP的LLM自动算法设计新框架

FunSearch成本高千次查询实现TSP优化的LLM算法设计新思路当Google的FunSearch需要百万级查询才能完成算法优化时香港城市大学与华为诺亚方舟实验室联合提出的EoH框架仅用数千次LLM调用就实现了同等甚至更优的效果。这种将自然语言思想与代码协同进化的方法正在重新定义自动启发式设计的效率边界。1. 传统AHD方法的瓶颈与突破自动启发式设计Automated Heuristic Design领域长期面临两个核心矛盾算法性能与计算成本的权衡、专家经验与自动化程度的平衡。传统方法如遗传编程GP需要预定义算法组件而超启发式方法则依赖人工构建的搜索空间。现有方法的主要局限方法类型典型代表核心问题计算成本遗传编程GP语法规则限制创新空间中等万次级LLM直接生成Zero-shot缺乏系统性优化低单次纯代码进化FunSearch仅函数级变异效率低下高百万级EoH框架的创新在于引入了思想进化层。就像人类设计师先构思算法逻辑再编写代码一样EoH让LLM同时优化自然语言描述和其对应的实现代码。这种双轨进化机制使得算法创新不再局限于语法层面的微调而是能在概念层面实现突破。实际测试显示在旅行商问题(TSP)上EoH仅用3000次LLM查询就达到了FunSearch需要50万次查询才能获得的优化效果成本降低两个数量级。2. EoH框架的协同进化机制EoH的核心是一个动态平衡的进化系统其工作流程可分为三个关键阶段2.1 思想-代码双表示体系每个启发式算法在EoH中被表示为class Heuristic: def __init__(self): self.description # 自然语言逻辑描述 self.code # 可执行代码 self.fitness 0.0 # 适应度评分这种双重表示带来了独特优势描述层捕捉算法的高层逻辑便于跨问题迁移代码层确保方案可执行保留实现细节适应度通过基准测试量化解决方案质量2.2 五维提示策略引擎EoH设计了五种针对性提示策略形成完整的进化谱系差异最大化探索(E1)[指令] 请基于以下3个父代启发式 - 父代1优先访问未覆盖的远距离节点 - 父代2使用动态权重平衡路径长度与节点密度 - 父代3采用聚类预处理减少搜索空间 [要求] 生成在策略上与前三个完全不同的新方法共性驱动探索(E2)从多个父代中提取共同模式如都包含空间划分思想然后生成新的划分策略单启发式优化(M1)分析现有方案的缺陷如计算复杂度高提出优化版本参数调优(M2)调整权重、阈值等参数而不改变整体结构组件简化(M3)移除冗余计算步骤提升执行效率2.3 动态种群管理每一代种群维持N个最优解通过锦标赛选择进行迭代更新。关键创新在于适应性评估不仅测试基准问题还验证跨问题泛化能力多样性保持自动检测并淘汰相似度过高的解决方案精英保留确保每代最优解不被随机淘汰3. TSP问题上的实战对比以100节点的旅行商问题为例我们对比了不同方法的优化效果性能对比表指标人工设计FunSearchEoH最优路径长度542.7521.3518.6收敛代数-500,0003,200CPU小时402,80062内存占用(GB)83212实现过程中的关键技巧包括问题表征优化# 传统坐标表示 cities [(x1,y1), (x2,y2), ...] # EoH改进表示 problem { distance_matrix: [...], # 预计算距离 features: { # 附加特征 cluster_labels: [...], centrality: [...] } }评估函数设计def evaluate(heuristic): # 基础路径长度 base_score calc_path_length(heuristic.code) # 多样性加分项 unique_components analyze_uniqueness(heuristic.description) # 复杂度惩罚项 time_penalty measure_runtime(heuristic.code) return base_score * 0.7 unique_components * 0.3 - time_penalty * 0.1提示工程模板你是一位算法设计专家当前正在解决旅行商问题优化。已有解决方案 {parent_heuristics} 请根据{strategy}策略 - 分析现有方案的优缺点 - 提出改进思路用自然语言描述 - 给出Python实现要求 - 新方案应在{aspect}方面有明显改进 - 代码时间复杂度不超过O(n^2) - 包含至少一个创新点4. 低成本实现方案对于资源有限的团队可以采用以下策略降低EoH实施门槛4.1 模型选型建议模型类型示例适用场景成本估算(千次查询)商业APIGPT-4原型验证阶段$15-20开源模型CodeLlama-34B生产环境部署$5(自建服务器)混合策略小模型过滤大模型精调平衡质量与成本$8-124.2 计算资源优化技巧并行化评估# 使用GNU parallel加速评估 cat population.json | parallel -j 8 python evaluate.py {}缓存机制缓存LLM响应避免重复查询预计算问题特征减少重复运算早期淘汰# 在进化早期采用宽松评估 if generation 10: eval_samples min(5, len(test_cases)) else: eval_samples len(test_cases)4.3 开源生态整合EoH官方代码库提供了完整的TSP实现示例from eoh import EOHFramework tsp_config { population_size: 30, max_generations: 100, llm_model: gpt-4-1106-preview, problem_type: tsp } framework EOHFramework(configtsp_config) best_heuristic framework.run()实际部署时建议从简单问题开始迭代先用10个节点的TSP验证流程逐步扩展到50-100节点最后处理真实业务场景的复杂问题在多次实验中一个有趣的发现是EoH生成的某些启发式虽然违背传统算法设计原则如同时考虑局部和全局特征但在特定问题分布下却表现出奇效。这提示我们LLM可能发现了人类专家尚未总结出的新模式。

零代码体验LingBot-Depth：在线Demo快速生成3D深度效果图

零代码体验LingBot-Depth：在线Demo快速生成3D深度效果图 1. 引言：当普通照片“看”懂了三维世界你有没有想过，一张普通的手机照片，除了记录下那一刻的色彩和构图，还能“记住”当时场景里每个物体离你有多远&#xf…...

2026/5/5 13:53:35 阅读更多 →

MMD Tools插件实战指南：打通Blender与MMD的创作壁垒

MMD Tools插件实战指南：打通Blender与MMD的创作壁垒【免费下载链接】blender_mmd_tools MMD Tools is a blender addon for importing/exporting Models and Motions of MikuMikuDance. 项目地址: https://gitcode.com/gh_mirrors/bl/blender_mmd_tools 定位…...

2026/4/30 1:19:30 阅读更多 →

从部署到接入：星图平台Qwen3-VL+Clawdbot+飞书全流程

从部署到接入：星图平台Qwen3-VLClawdbot飞书全流程 1. 引言在上一篇文章中，我们完成了Qwen3-VL:30B模型在CSDN星图AI云平台的私有化部署。本文将带您完成整个流程的最后一步：通过Clawdbot将这个大模型能力接入飞书平台，打造企业…...

2026/5/6 4:20:30 阅读更多 →

大模型 Agent 三面被问：怎么解决 Skill 的依赖关系？我是这么答的

前段时间有个读者去面某大厂的 Agent 岗位，三面被甩出来一道题当场卡壳。题目听着挺朴素：“如果你的 Agent 里面有很多 Skill，Skill 之间还存在依赖关系的话，你打算怎么去设计来解决这个问题？” 他跟我复盘的时候说&a…...

2026/7/28 17:22:23 阅读更多 →

抱怨应试教育的苦，却不知道：那已经是人生里最轻松、最公平的一段路了

能靠考试得到的东西，都是天上掉馅饼上学的时候，总觉得考试是天底下最熬人的苦。背不完的知识点，刷不完的题，熬不完的夜，一张卷子定输赢的应试制度，曾被无数人吐槽是束缚、是枷锁。那时候总天真地以为，等走出校园、踏入社会，就能摆脱考试的桎梏，凭真本事自由闯荡。 …...

2026/7/28 21:12:22 阅读更多 →

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate

华硕笔记本终极控制工具：如何用G-Helper取代臃肿的Armoury Crate 【免费下载链接】g-helper Lightweight Armoury Crate alternative for Asus laptops with nearly the same functionality. Works with ROG Zephyrus, Flow, TUF, Strix, Scar, ProArt, Vivobook, Z…...

2026/7/28 19:39:15 阅读更多 →