您的位置:首页 > 股票知识 > 股价基本分析 > 聚类分析包括哪两种类型|聚类分析孤立点挖掘

聚类分析包括哪两种类型|聚类分析孤立点挖掘

时间:2013-09-08   来源:股价基本分析   点击:

聚类分析孤立点挖掘

孤立点是指一个数据集与其他数据有着显著区别的数据对象的集合。例如运动员:乔丹、舒马赫、布勃卡。

孤立点挖掘的过程是:给定一个n个数据对象的集合,以及预期的孤立点数目k,发现与剩余的数据有着显著差异的k个数据对象。

孤立点挖掘的主要应用在:信用卡欺诈检测、移动电话欺诈检测、客户划分、医疗分析(异常)。

1)基于距离的孤立点检测

为了解决统计学方法带来的一些限制,引入了基于距离的孤立点检测,在不知道数据分布的情况下对数据进行多维分析。

基于距离的孤立点是指:数据集合S中的基于距离的孤立点o的集合可以表示为DB(p,d),即数据集合S中的对象至少有p部分与对象o的距离大于d(说明该对象o没有足够的邻居)。

挖掘墓于距离的孤立点的高效算法有:基于索引的算法、嵌套一循环算法、基于单元的算法等。

2)基于偏离的孤立点检测

通过检查一组对象的主要特征来确立孤立点,即与主要特征的描述相偏离的对象被认为是孤立点。

基于偏离的孤立点的探测技术有如下两种:

(1)序列异常技术:模仿人类从一系列被假定为类似的对象中识别异常对象的方式。

(2)OLAP数据立方体技术:在大规模的多维数据中采用数据立方体来确定异常区域。如果一个立方体的单元值显著地不同于根据统计模型得到的期望值,则该单元值被认为是一个异常,并用可视化技术表示。


推荐内容

推荐文章

栏目导航

友情链接

网站首页
早报
原创
名家
新闻
学堂
期货
理财
外汇
炒股软件
股票知识
K线图
平均线
分时图
短线炒股
MACD
涨停板
强势股
热门资讯

copyright 2016-2018 股民股票网保留所有权 京ICP备16025527号 免责声明:网站部分内容转载至网络,如有侵权请告知删除