别再死记硬背了！用Python实战5个经典问题，彻底搞懂贪心算法

张

张建站

2026/5/31 3:27:01

10分钟阅读

用Python实战5大经典问题掌握贪心算法的核心逻辑第一次接触贪心算法时很多人会被它简单粗暴的特性所迷惑——看似只需要每一步选择当前最优解但真正动手实现时却常常陷入局部最优的陷阱。本文将带你通过五个经典问题的完整实现过程从代码细节中理解贪心策略的精妙之处。不同于教科书式的理论讲解我们会重点关注每个问题在实际编码中的关键转折点和易错环节。1. 从硬币找零问题理解贪心算法的局限性找零问题是最直观的贪心算法入门案例。假设我们需要用面额为[1, 5, 10, 20, 50]的硬币凑出63元贪心策略会优先选择最大面额def greedy_change(amount, coins): coins.sort(reverseTrue) # 关键步骤降序排列 change [] for coin in coins: while amount coin: change.append(coin) amount - coin return change if amount 0 else None # 处理无法找零的情况这个实现有三个值得注意的细节降序排序确保优先使用大面额while循环保证尽可能多地使用当前面额最终检查处理无法精确找零的情况注意当硬币面额为[1, 3, 4]时用贪心算法凑6元会得到[4,1,1]而非最优解[3,3]。这是理解贪心局限性的典型案例。硬币问题的现实变体包括自动售货机的找零系统支付系统的最小纸币组合资源分配中的最小单位切割2. 活动选择问题中的贪心策略证明会议室安排是活动选择问题的典型场景。我们需要在多个活动中选择最多数量的互不冲突活动def select_activities(activities): activities.sort(keylambda x: x[1]) # 按结束时间排序 selected [activities[0]] for start, end in activities[1:]: if start selected[-1][1]: # 检查时间冲突 selected.append((start, end)) return selected这个实现揭示了贪心算法的关键特征排序标准的选择按结束时间而非开始时间排序冲突检测只需比较与最后一个入选活动的时间时间复杂度O(nlogn)主要来自排序步骤实际应用中的常见误区错误地按持续时间排序忽略活动可能已经按某种顺序排列的情况未考虑活动权重时的简单贪心失效3. 霍夫曼编码中的优先队列应用数据压缩领域的经典算法展示了贪心策略如何构建最优前缀码import heapq from collections import defaultdict class HuffmanNode: def __init__(self, charNone, freq0): self.char char self.freq freq self.left None self.right None def __lt__(self, other): return self.freq other.freq def build_huffman_tree(freq_map): heap [HuffmanNode(char, freq) for char, freq in freq_map.items()] heapq.heapify(heap) while len(heap) 1: left heapq.heappop(heap) right heapq.heappop(heap) merged HuffmanNode(freqleft.freq right.freq) merged.left, merged.right left, right heapq.heappush(heap, merged) return heap[0]实现中的关键技术点优先队列的使用heapq模块实现最小堆节点类的定义需要实现__lt__方法支持比较树的构建过程自底向上合并频率最低的节点调试霍夫曼编码时常见的问题忘记处理单字符的特殊情况编码表生成时的路径记录错误非文本数据的频率统计方式4. 最小生成树问题的两种贪心视角Prim算法展示了贪心策略在图论中的应用import heapq def prim_mst(graph): n len(graph) visited [False] * n heap [(0, 0)] # (weight, vertex) mst_edges [] while heap and len(mst_edges) n - 1: weight, u heapq.heappop(heap) if not visited[u]: visited[u] True if weight 0: # 忽略初始节点 mst_edges.append((u, weight)) for v, w in graph[u]: if not visited[v]: heapq.heappush(heap, (w, v)) return mst_edges关键实现细节邻接表的表示graph使用字典存储边和权重堆的初始化从任意节点开始这里选择节点0边的筛选避免将初始节点的虚拟边加入结果与Kruskal算法的对比特性Prim算法Kruskal算法数据结构优先队列并查集时间复杂度O(ElogV)O(ElogE)适用场景稠密图稀疏图5. 车辆路径问题中的最近邻启发式物流配送中的路径规划展示了贪心策略的实际价值import numpy as np def vehicle_routing(customers, depot): route [depot] unvisited set(customers) while unvisited: current route[-1] nearest min(unvisited, keylambda x: np.linalg.norm(np.array(x)-np.array(current))) route.append(nearest) unvisited.remove(nearest) route.append(depot) # 返回仓库 return route实现中的优化空间距离计算优化预先计算所有点对之间的距离候选集缩减只考虑附近的若干候选点并行计算同时评估多个候选点的距离实际业务中的常见调整加入时间窗口约束考虑车辆容量限制处理动态新增的客户点

朝着可靠的合成控制

原文：towardsdatascience.com/towards-reliable-synthetic-control-156106a1a7cb?sourcecollection_archive---------10-----------------------#2024-04-16 使估计的处理效应接近真实值 https://medium.com/hangyu_5199?sourcepost_page---byline--156106a1a7cb…...

2026/5/31 3:26:07 阅读更多 →