【IoT美学】深度学习:IoT场景下的AI应用与开发—AI智慧选址
一、大数据“慧”说话
大数据 – 商业时代“新能源”
配送仓库选址问题
配送仓库选址问题总体是一个p-中值问题,即已知若干需求点的坐标和配送需求量,在空间中选取p个位置作为配送中心,使得所有需求点到归属的配送中心的加权距离和最小。
配送仓库选址影响因素
配送仓库选址流程
选址问题解决方案
启发式算法:NP-Hard问题,传统选址问题的常用方法;
基于专家咨询的层次分析法(AHP):“经验”驱动业务,决策受到专家的经验和领域知识限制
中值法/重心法:主要考虑运输成本和效率,实用性强,但考虑因素 较单一
聚类方法
二、“物以类聚”:类聚算法
聚类分析
聚类分析是分析研究对象(样品或变量)如何按照多个方面的特征进行综合分类的一种多元统计方法,它是根据物以类聚的原理将相似的样品(或变量)归为一类。
聚类算法应用
离群点检测
客户分群
根据客户数据,将相似性较高的客户聚为一类,打标签,进行客户类别细分,通过构建的用户画像进行精准营销
空间选址
通过地理位置的经纬度进行聚类计算,找出簇中心点,到簇中每个样本点的距离之和最短。
常见聚类算法分类
K-Means聚类算法
先确定聚类的数目k,然后将样本划分成k个聚类,并使得每个样本到其所在聚类的中心的距离平方和最小。
聚类度量方法
“近朱者赤,近墨者黑”——使用距离表示亲疏和相似程度
距离计算方法
K-Means聚类优缺点
K-Mediods聚类
K-Mediods与K-Means对比
K-Means的改进算法K-Means++
K值确定方法
谱系图: 在谱系图的基础上,通过设定临界值(阀值)进行划分;
散点图: 二或三个变量可直接画散点图,多个变量先计算出二或三个综合变量;
统计量: 通过构造一些统计量来进行近似检验;
层次聚类
凝聚层次聚类:又叫自底向上法, 先把每个样本看成一个类,计算出类的两两距离,然后将距离最近的类合并成新类,并计算新类与其他类的距离,重复合并过程直到所有样本都合并成一类为止。
分裂层次聚类:又叫自顶向下法,一开始将所有样本划分到一个簇中,每一次迭代都将簇划分为一个更小的类,直到每个样本都在一个单独的簇中。
两个簇之间的距离判断
簇间距离计算方法
簇间距离判断示例
层次聚类优缺点
密度聚类法
密度聚类是通过聚类的簇是否紧密相连来判断样本点是否属于一个簇,代表性的算法就是DBSCAN,它基于一组邻域参数来判断某处样本是否是紧密。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种很典型的密度聚类算法,和K-Means,BIRCH这些一般只适用于凸样本集的聚类相比,DBSCAN还适用于非凸样本集。
DBSCAN算法的基本概念
DBSCAN聚类算法描述
DBSCAN算法
DBSCAN聚类算法优缺点
聚类模型评估
Silhonette 轮廓系数
聚类算法选型
三、配送仓库选址案例实施
空间选址数据准备
K-Means算法应用
K-Means算法参数
四、实验
见附件
- 点赞
- 收藏
- 关注作者
评论(0)