7种常用的聚类方法有哪些（聚类和分类的区别）

仰望辉煌。　　 • 2022年3月16日上午1:33 • 创业分享

典型聚类算法

基于划分的方法

代表：kmeans算法

基于层次的方法

代表：CURE算法

基于网格的方法

代表：STING算法

将数据集合X划分多层网格结构，从某一层开始计算查询该层网格间的属性值，计算属性值与阈值的关系，判定网格间的相关情况，不相关的网格不作考虑如果网格相关，则进入下一层的相关区域继续第二步，直到下一层为最底层返回相关网格结果

基于密度的方法

代表：DBSCAN算法

输入数据集合X，随机选取一点，并找出这个点的所有高密度可达点遍历此点的所有 ε 邻域内的点，并寻找这些密度可达点，判定某点 ε− 邻域内的点，并寻找这些点密度可达点，判定某点的 ε− 邻域内的点数是否超过阈值点数，超过则构成核心点扫描数据集，寻找没有被聚类的数据点，重复第二步输出划分的类，并输出异常值点（不和其他密度相连）

神经网络的方法

代表：SOM算法

基于图的聚类方法

代表：谱聚类算法

聚类算法的评价指标

一个好的聚类方法可以产生高品质簇，是的簇内相似度高，簇间相似度低。一般来说，评估聚类质量有两个标准，内部质量评价指标和外部评价指标。

内部质量评价标准

内部评价指标是利用数据集的属性特征来评价聚类算法的优劣。通过计算总体的相似度，簇间平均相似度或簇内平均相似度来评价聚类质量。评价聚类效果的高低通常使用聚类的有效性指标，所以目前的检验聚类的有效性指标主要是通过簇间距离和簇内距离来衡量。这类指标常用的有CH（Calinski-Harabasz）指标等

CH指标

CH指标定义为：

簇的凝聚度

簇内点对的平均距离反映了簇的凝聚度，一般使用组内误差平方（SSE）表示：

簇的邻近度

簇的邻近度用组间平方和（SSB）表示，即簇的质心 C_i 到簇内所有数据点的总平均值 c 的距离的平方和

外部质量评价标准

外部质量评价指标是基于已知分类标签数据集进行评价的，这样可以将原有标签数据与聚类输出结果进行对比。外部质量评价指标的理想聚类结果是：具有不同类标签的数据聚合到不同的簇中，具有相同类标签的数据聚合相同的簇中。外部质量评价准则通常使用熵，纯度等指标进行度量。

熵：

簇内包含单个类对象的一种度量。对于每一个簇，首先计算数据的类分布，即对于簇 i ，计算簇 i 的成员属于类 j 的概率

其中m_i表示簇 i 中所有对象的个数，而 m_ij 是簇 i中类 j 的对象个数。使用类分布，用标准公式：

计算每个簇 i 的熵，其中K是类个数。簇集合的总熵用每个簇的熵的加权和计算即：

其中K是簇的个数，而 m 是簇内数据点的总和

纯度：

簇内包含单个类对象的另外一种度量。簇 i 的纯度为

，而聚类总纯度为：

仰望辉煌。　　

0 0

思维模型：建立高品质思维的30种模型（通俗易懂、立即见效）

笔记作者：明冬亮30种揭示真正智慧的思维模型、通俗易懂、离我们很近、干货满满且能立即见效，值得学习实践。资源目录第一章：如何快速做决策第二章：更清晰看待问题第三章：找到解决方案第四章：反向思维模型第五章：经典思维模型【完整版领取方式见文末】

小多多
2023年4月4日 • 创业分享
艺术家要获得商业思维和厚脸皮

CONTEMPORARY ARTISTBrooke Cormier⊙作为一名艺术家不仅仅是制作艺术品，还需要获得商业思维和厚脸皮。BYBrooken. 01 艺术家简介加拿大艺术家Brooke Cormier，1994年出生，现居维也纳，一

小多多
2023年4月14日 • 创业分享
网络营销主管任职要求，简述我国网络营销发展现状

网络营销一次近几年还是比较深入人心的，现在特别多的公司已经开始重视网络营销，相信看本文的都是对网络营销比较感兴趣的。或者已从事这个行业多年。正所谓不想当将军的士兵不是一个好士兵，那…

仰望辉煌。　　
创业分享 2022年3月15日
捷安特旅行自行车价格（简介捷安特自行车及报价）

2000元对于山地车来说只能说是娱乐级，还没有达到入门级，但是各个部件如变速器，刹车，前叉等等，还是有一定性能的，车架通常是铝合金车架，（也许有一些厂家有2000元左右的碳纤维山地…

仰望辉煌。　　
2022年3月15日 • 创业分享
徕卡单反相机价格（徕卡相机官方旗舰店）

1月10日消息，徕卡相机宣布，将于1月13日晚10点举行“续写传奇”新品发布会，很可能发布新的专业全画幅旁轴相机M11，预计售价在7000欧元（约50750元人民币）左右。旁轴相…

仰望辉煌。　　
创业分享 2022年3月16日
小型投资办厂项目（小投资办厂什么好？）

当前的创业环境是非常严峻的，对于创业者而言，想有所作为就要谨慎从事，特别是在创业项目的选择上，要深入研究市场。回答这个粉丝的问题，现在开办小工厂，有哪些项目比较合适呢？我这里给大家推荐一些，仅供用于市场调研参考。

空白
2021年11月18日 • 创业分享
怎么测试网速(无需下载软件轻松测试网速)

1.首先我们点击“开始菜单”，展开左侧窗口中的附件–运行。如下图所示： 2.在运行窗口中输入“CMD”命令，并确定。如下图所示： 3.输入“ping 192.168.1…

万能墙
2021年11月6日 • 创业分享
网上商城如何推广，网上商城推广方案

网站的开发，就是企业进行网络营销的渠道，现在什么类型的网站带来的盈利最大，相信大家应该都了解，就是电子商务网站，现在随着时代的发展，我们的生活品质不断的提高，也使得越来越多的人开始…

仰望辉煌。　　
创业分享 2022年3月16日
陌陌引流方法是什么（详解陌陌推广技巧）

陌陌是于2011年8月推出的一款基于地理位置的开放式移动视频社交应用，是中国的开放式社交平台。在MOMO,用户可以通过视频、文字、语音、图片来展示自己，基于地理位置发现附近的人…

仰望辉煌。　　
2022年3月16日 • 创业分享
华为mate20发布时间及价格，Mate20详细参数配置

10月下旬将出现多款安卓旗舰机发布，并且都是重磅产品。作为2018下半年最值得期待的手机，华为新旗舰Mate 20系列备受瞩目。华为官方也正式公布了发布会具体时间：伦敦时间10月1…

仰望辉煌。　　
2022年3月16日 • 创业分享
现在汉堡店利润有多少（汉堡生意能不能干）

事例上，要晓得一个六元的汉堡利润是很单纯的，咱们须要从二个圆里入止单纯的剖析，即资料的老本战店里的老本。 1、资料老本:正常去说，一个汉堡须要的资…

实体店老油条
创业分享 2021年11月27日
做预算的软件有哪些（盘点各种工程造价所需软件）

工程造价—顾名思义，建造一项工程需要投入的价钱，重点在“量、价”，现在的很多造价新人，过度依赖软件，离开软件就不会算量，不会套价，软件中计算出来的数据也弄不清楚原理，…

仰望辉煌。　　
2022年3月15日 • 创业分享
美的冰箱保鲜室结冰怎么回事（美的冰箱温度调节图解）

冰箱保鲜室结冰，通常是不正常的表现，属于冰箱本身和人为原因，具体原因如下： 1、冰箱里放入了没有冷却的食物所致。由于食物里的热量会在冰箱里遇冷，形成冷凝水，吸附在冰箱的内壁，而冰箱…

仰望辉煌。　　
2022年3月15日 • 创业分享
联想笔记本电源管理软件在哪里（联想win10电源管理软件介绍）

随着时代的飞速发展，笔记本的使用已经相当广泛了，那么问题就来了，当我们使用笔记本时突然出现各种故障该怎么办呢，可能送修是最好的解决办法，但也不是唯一的办法，今天就让我们来看看笔记本…

仰望辉煌。　　
2022年3月16日 • 创业分享
未来的互联网，价值观取向和商业模式同等重要

在未来的互联网世界中，价值观取向很重要，商业模式也很重要。创业很难熬，但是也正是辛苦造就了一个个接触的人，抓紧机遇，对不起的是自己，对得起是人生。 2010年以前，其实大部分的互联…

小多多
创业分享 2022年1月18日

发表回复

登录后才能评论

7种常用的聚类方法有哪些（聚类和分类的区别）

典型聚类算法

聚类算法的评价指标

外部质量评价标准

相关推荐

发表回复