热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

分层聚类算法

分层聚类算法转载▼看到很多地方都讲到分层聚类法,这到底是什么东东,今天来研究一下。分层聚类法是聚类算法的一种,聚类算法是数据挖掘的核心技术

分层聚类算法

 
转载





看到很多地方都讲到分层聚类法,这到底是什么东东,今天来研究一下。

分层聚类法是聚类算法的一种,聚类算法是数据挖掘的核心技术,把数据库中的对象分类是数据挖掘的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大。

聚类算法一般分为分割分层两种。

分割聚类算法通过优化评价函数把数据集分割为K个部分,它需要K作为输人参数。

典型的分割聚类算法有K-means算法, K-medoids算法、CLARANS算法。

分层聚类由不同层次的分割聚类组成,层次之间的分割具有嵌套的关系。它不需要输入参数,这是它优于分割聚类算法的一个明显的优点,其缺点是终止条件必须具体指定。

典型的分层聚类算法有BIRCH算法、DBSCAN算法和CURE算法等。

各聚类算法的比较结果

算法        算法效率   适合的数据类型   发现的聚类类型   对脏数据或异常数据的敏感性   对数据输入顺序的敏感性
BIRCH         高            数值              凸形或球形                  不敏感                          不太敏感
DBSCAN     一般          数值                任意形状                    敏感                               敏感
CURE         较高          数值                任意形状                   不敏感                          不太敏感
K-poto      一般         数值和符号         凸形或球形                  敏感                                一般
CLARANS   较低           数值               凸形或球形                  不敏感                          非常敏感
CUQUE      较低           数值               凸形或球形                  一般                               不敏感

参考文献

【1】张红云、刘向东、段晓东、苗夺谦、马垣,数据挖掘中聚类算法比较研究,《计算机应用与软件》2003 Vol.20 No.2 : 5~6



推荐阅读
author-avatar
手机用户2502903053
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有