- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

算法选择困难症：我是如何在动态规划、贪心、回溯和分支限界中找到最优解的

8181暴风雪发表于 2025/07/26 18:48:28 2025/07/26

【摘要】物流配送优化的项目，听起来挺简单：给定100个配送点，规划最优配送路线。项目经理信心满满：“这不就是个旅行商问题吗？网上代码一大把。”结果做起来才发现，这哪是旅行商问题，这是旅行商问题他爹！时间窗口限制、车辆容量限制、司机工作时间限制、实时路况…各种约束条件叠加，让这个问题的复杂度爆炸式增长。我们前后尝试了动态规划、贪心算法、回溯算法、分支限界等各种方法，每种算法都有自己的故事。今天就来聊聊...

物流配送优化的项目，听起来挺简单：给定100个配送点，规划最优配送路线。项目经理信心满满：“这不就是个旅行商问题吗？网上代码一大把。”

结果做起来才发现，这哪是旅行商问题，这是旅行商问题他爹！时间窗口限制、车辆容量限制、司机工作时间限制、实时路况…各种约束条件叠加，让这个问题的复杂度爆炸式增长。

我们前后尝试了动态规划、贪心算法、回溯算法、分支限界等各种方法，每种算法都有自己的故事。今天就来聊聊这段"算法选择困难症"的经历。

问题定义：比想象中复杂100倍

先看看我们面临的配送场景：

约束条件	具体要求	影响	难度等级
配送点数量	100-500个/天	解空间巨大	★★★★☆
时间窗口	每个客户指定2小时	必须准时	★★★★★
车辆容量	每车最多50件	需要多次往返	★★★☆☆
司机工时	每天最多8小时	路线长度受限	★★★☆☆
实时路况	拥堵情况动态变化	需要动态调整	★★★★★
客户优先级	VIP必须优先配送	打乱最优顺序	★★★★☆

贪心算法：简单粗暴的第一次尝试

测试规模	计算时间	路线总长度	相比最优解	客户满意度
10个点	0.001秒	45km	+15%	85%
50个点	0.01秒	186km	+28%	72%
100个点	0.05秒	425km	+35%	61%
200个点	0.2秒	980km	+42%	45%

改进的贪心策略

我们尝试了多种贪心策略：

策略名称	核心思想	优点	缺点	实际效果
最近邻	总是选最近的	简单快速	容易陷入局部最优	★★☆☆☆
最远插入	先构建骨架	整体性较好	仍有局部性	★★★☆☆
节约算法	最大化节约距离	考虑全局	计算复杂	★★★☆☆
扫描算法	按角度扫描	适合聚类分布	对散点效果差	★★☆☆☆

最终发现，纯贪心算法在这个复杂场景下就是不够用。

动态规划：理论完美但现实骨感

状态压缩DP

对于小规模问题，我们尝试了动态规划：

def dp_tsp(dist_matrix, n):
    # dp[mask][i] = 访问了mask中的点，当前在i点的最短距离
    dp = [[float('inf')] * n for _ in range(1 << n)]
    dp[1][0] = 0  # 从0号点出发
    
    for mask in range(1, 1 << n):
        for u in range(n):
            if not (mask & (1 << u)):
                continue
            for v in range(n):
                if mask & (1 << v):
                    continue
                new_mask = mask | (1 << v)
                dp[new_mask][v] = min(dp[new_mask][v], 
                                     dp[mask][u] + dist_matrix[u][v])
    
    # 找最优解
    return min(dp[(1 << n) - 1][i] for i in range(n))

DP的理论vs现实：

问题规模	理论复杂度	实际耗时	内存占用	可行性
n=10	O(n²·2ⁿ)	0.02秒	10KB	✓可行
n=15	O(n²·2ⁿ)	0.5秒	960KB	✓可行
n=20	O(n²·2ⁿ)	12秒	80MB	✓勉强可行
n=25	O(n²·2ⁿ)	6分钟	3.2GB	✗不可行
n=30	O(n²·2ⁿ)	预计3小时	100GB+	✗不可行

结论：标准DP只能解决20个点以内的问题，而我们有100+个点！

分组DP优化

既然不能一次解决所有点，我们尝试了分组：

def grouped_dp_delivery(points, group_size=15):
    # 1. 聚类分组
    groups = cluster_points(points, group_size)
    
    # 2. 组内DP求最优
    group_routes = []
    for group in groups:
        route = dp_tsp_for_group(group)
        group_routes.append(route)
    
    # 3. 组间连接
    final_route = connect_groups(group_routes)
    
    return final_route

分组策略效果：

分组方法	组内算法	总耗时	路线质量	实用性
K-means聚类	DP	5秒	较好(+15%)	★★★★☆
地理网格	DP	3秒	一般(+20%)	★★★☆☆
时间窗口分组	DP	8秒	好(+12%)	★★★★☆
混合分组	DP+贪心	4秒	较好(+18%)	★★★★☆

回溯算法：在剪枝艺术中寻找平衡

基础回溯框架

回溯算法理论上能找到最优解，关键是剪枝：

class BacktrackingSolver:
    def __init__(self, points, constraints):
        self.points = points
        self.constraints = constraints
        self.best_route = None
        self.best_cost = float('inf')
        self.nodes_explored = 0
        
    def solve(self):
        self.backtrack([], set(range(len(self.points))), 0, 0)
        return self.best_route, self.best_cost
    
    def backtrack(self, current_route, remaining, current_cost, current_time):
        self.nodes_explored += 1
        
        # 剪枝1：成本剪枝
        if current_cost >= self.best_cost:
            return
        
        # 剪枝2：时间窗口剪枝
        if not self.check_time_windows(current_route, current_time):
            return
        
        # 剪枝3：容量剪枝
        if not self.check_capacity(current_route):
            return
        
        if not remaining:
            # 找到一个完整解
            if current_cost < self.best_cost:
                self.best_cost = current_cost
                self.best_route = current_route.copy()
            return
        
        # 启发式排序，优先尝试更可能的选择
        candidates = self.order_candidates(remaining, current_route)
        
        for next_point in candidates:
            # 剪枝4：下界估计
            lower_bound = self.estimate_lower_bound(current_cost, remaining)
            if lower_bound >= self.best_cost:
                continue
                
            current_route.append(next_point)
            remaining.remove(next_point)
            
            new_cost = current_cost + self.calculate_cost(current_route)
            new_time = current_time + self.calculate_time(current_route)
            
            self.backtrack(current_route, remaining, new_cost, new_time)
            
            # 回溯
            current_route.pop()
            remaining.add(next_point)

剪枝策略效果对比

不同剪枝策略的效果天差地别：

剪枝策略	搜索节点数	找到最优解时间	剪枝效率	实现难度
无剪枝	10¹⁰⁰	永远	0%	★☆☆☆☆
简单上界	10⁸	2小时	99.99%	★★☆☆☆
成本下界估计	10⁶	5分钟	99.9999%	★★★☆☆
时间窗口剪枝	10⁵	30秒	99.99999%	★★★★☆
综合剪枝	10⁴	5秒	99.999999%	★★★★★

实际应用效果

问题规模	无剪枝	基础剪枝	高级剪枝	最优解偏差
10个点	1秒	0.1秒	0.01秒	0%(最优)
20个点	30分钟	10秒	0.5秒	0%(最优)
30个点	>24小时	5分钟	8秒	0%(最优)
50个点	不可行	2小时	3分钟	<2%(近似)
100个点	不可行	不可行	30分钟	<5%(近似)

分支限界：回溯的优化版

优先队列优化

分支限界使用优先队列，总是扩展最有希望的节点：

import heapq

class BranchAndBoundSolver:
    def solve(self):
        # 优先队列，按下界排序
        pq = [(0, [], set(range(len(self.points))))]
        
        while pq:
            lower_bound, current_route, remaining = heapq.heappop(pq)
            
            # 上界剪枝
            if lower_bound >= self.best_cost:
                continue
            
            if not remaining:
                # 更新最优解
                actual_cost = self.calculate_total_cost(current_route)
                if actual_cost < self.best_cost:
                    self.best_cost = actual_cost
                    self.best_route = current_route
                continue
            
            # 分支：尝试所有可能的下一个点
            for next_point in remaining:
                new_route = current_route + [next_point]
                new_remaining = remaining - {next_point}
                
                # 计算新的下界
                new_lower_bound = self.calculate_lower_bound(
                    new_route, new_remaining
                )
                
                if new_lower_bound < self.best_cost:
                    heapq.heappush(pq, 
                        (new_lower_bound, new_route, new_remaining)
                    )

下界估计方法对比

好的下界估计是分支限界的核心：

下界方法	计算复杂度	紧密程度	剪枝效果	综合评分
最小生成树	O(n²)	较紧	好	★★★★☆
1-tree	O(n²)	紧	很好	★★★★★
线性规划松弛	O(n³)	最紧	最好	★★★☆☆
贪心估计	O(n)	松	一般	★★☆☆☆
组合下界	O(n²)	紧	很好	★★★★☆

分支限界vs回溯

实际测试数据：

算法	搜索策略	内存占用	找到第一个解	找到最优解	适用场景
回溯(DFS)	深度优先	O(n)	快	慢	快速得到可行解
分支限界(BFS)	最优优先	O(bⁿ)	慢	较快	追求最优解
混合策略	限深+最优	O(n·b)	较快	较快	平衡场景

算法融合：1+1>2的效果

混合算法框架

单一算法都有局限，我们最终采用了混合策略：

class HybridOptimizer:
    def optimize(self, points, time_limit=60):
        # 阶段1：贪心快速得到初始解（1秒）
        greedy_route = self.greedy_solve(points)
        best_route = greedy_route
        best_cost = self.calculate_cost(greedy_route)
        
        # 阶段2：局部搜索优化（5秒）
        improved_route = self.local_search(greedy_route, time_limit=5)
        if self.calculate_cost(improved_route) < best_cost:
            best_route = improved_route
            best_cost = self.calculate_cost(improved_route)
        
        # 阶段3：分组动态规划（20秒）
        if len(points) > 30:
            dp_route = self.grouped_dp(points, group_size=15)
            if self.calculate_cost(dp_route) < best_cost:
                best_route = dp_route
                best_cost = self.calculate_cost(dp_route)
        
        # 阶段4：限时分支限界（剩余时间）
        remaining_time = time_limit - 26
        if remaining_time > 10:
            bb_route = self.branch_and_bound(
                points, 
                initial_bound=best_cost,
                time_limit=remaining_time
            )
            if bb_route and self.calculate_cost(bb_route) < best_cost:
                best_route = bb_route
        
        return best_route

各算法在混合框架中的作用

算法组件	执行顺序	时间分配	主要作用	贡献度
贪心初始化	1	1-2%	快速基准解	15%
局部搜索	2	8-10%	改进解质量	25%
分组DP	3	30-35%	局部最优	35%
分支限界	4	50-55%	全局优化	25%

最终效果

在真实的配送场景中测试：

测试日期	配送点数	纯贪心	纯DP	纯回溯	混合算法	实际里程
周一	87	385km	-	332km	318km	325km
周二	125	512km	-	-	425km	431km
周三	156	687km	-	-	548km	560km
周四	98	423km	-	378km	352km	358km
周五	213	945km	-	-	756km	772km

混合算法的解已经非常接近实际最优了！

算法选择决策树

基于这个项目的经验，我总结了一个算法选择决策树：

问题特征	推荐算法	原因	注意事项
n<20，要最优解	动态规划	能得到真正最优解	注意内存
n<50，时间充足	分支限界	平衡效果好	下界要紧
n>100，要快	贪心+局部搜索	速度快	解不一定好
约束条件多	回溯+剪枝	灵活处理约束	剪枝是关键
实时调整	贪心+增量更新	响应快	牺牲最优性
综合场景	混合算法	各取所长	实现复杂

经验总结

1. 没有万能算法

每种算法都有自己的适用场景：

贪心：快但不优
DP：优但规模受限
回溯：灵活但可能慢
分支限界：平衡但实现难

2. 理论与实践的差距

理论复杂度只是参考，常数项影响巨大
实际数据的特征比最坏情况重要
工程实现的细节决定成败

3. 混合策略往往最实用

用简单算法快速获得基准解
用复杂算法在时间允许范围内改进
保持算法的可中断性和增量性

4. 监控和调优同样重要

我们建立的监控指标：

监控项	阈值	频率	用途
算法耗时	<60秒	每次	性能监控
解的质量	<贪心1.5倍	每次	质量保证
内存占用	<4GB	实时	资源控制
剪枝效率	>99%	每日	算法调优

写在最后

这个项目让我深刻理解了"算法设计与分析"的真谛：不是要找到理论上最优的算法，而是要在约束条件下找到最实用的方案。

有时候，一个简单的贪心算法加上精心设计的启发式规则，效果比复杂的最优算法还好。关键是理解问题的本质，理解每种算法的特点，然后做出合适的选择。

记住：最好的算法是解决了问题的算法，而不是理论上最优雅的算法。

如果你也在做类似的优化问题，欢迎交流！算法优化这条路，需要不断实践和思考。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

算法选择困难症：我是如何在动态规划、贪心、回溯和分支限界中找到最优解的

问题定义：比想象中复杂100倍

贪心算法：简单粗暴的第一次尝试

最近邻贪心策略

改进的贪心策略

动态规划：理论完美但现实骨感

状态压缩DP

分组DP优化

回溯算法：在剪枝艺术中寻找平衡

基础回溯框架

剪枝策略效果对比

实际应用效果

分支限界：回溯的优化版

优先队列优化

下界估计方法对比

分支限界vs回溯

算法融合：1+1>2的效果

混合算法框架

各算法在混合框架中的作用

最终效果

算法选择决策树

经验总结

1. 没有万能算法

2. 理论与实践的差距

3. 混合策略往往最实用

4. 监控和调优同样重要

写在最后

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

算法选择困难症：我是如何在动态规划、贪心、回溯和分支限界中找到最优解的

问题定义：比想象中复杂100倍

贪心算法：简单粗暴的第一次尝试

最近邻贪心策略

改进的贪心策略

动态规划：理论完美但现实骨感

状态压缩DP

分组DP优化

回溯算法：在剪枝艺术中寻找平衡

基础回溯框架

剪枝策略效果对比

实际应用效果

分支限界：回溯的优化版

优先队列优化

下界估计方法对比

分支限界vs回溯

算法融合：1+1>2的效果

混合算法框架

各算法在混合框架中的作用

最终效果

算法选择决策树

经验总结

1. 没有万能算法

2. 理论与实践的差距

3. 混合策略往往最实用

4. 监控和调优同样重要

写在最后

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品