您的位置:首页 > 股票知识 > 量化投资 > 【数据挖掘需要学什么】数据挖掘量化投资方法

【数据挖掘需要学什么】数据挖掘量化投资方法

时间:2013-04-21   来源:量化投资   点击:

数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。

与数据挖掘相近的同义词有数据融合、数据分析和决策支持等。在量化投资中,数据挖掘的主要技术包括关联分析、分类/预测、聚类分析等。

数据挖掘量化投资方法

关联分析是研究两个或两个以上变量的取值之间存在某种规律性。例如,研究股票的某些因子发生变化后,对未来一段时间股价之间的关联关系。关联分为简单关联、时序关联和因巢关联。关联分析的目的是找出数据库中隐藏的关联网。一般用支持度和可信度两个阈值来度量关联规则的相关性,还不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。

分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵描述,并用这种描述来构造模型,一般用规则或决策树模式表示。分类是利用训练数据集通过一定的算法而求得分类规则。分类可被用于规则描述和预测。

预测是利用历史数据找出变化规律,建立模型,并由此模型对未来数据的种类及特征进行预测。预测关心的是精度和不确定性,通常用预测方差来度量。

聚类就是利用数据的相似性判断出数据的聚合程度,使得同一个类别中的数据尽可能相似,不同类别的数据尽可能相异。


推荐内容

推荐文章

栏目导航

友情链接

网站首页
早报
原创
名家
新闻
学堂
期货
理财
外汇
炒股软件
股票知识
K线图
平均线
分时图
短线炒股
MACD
涨停板
强势股
热门资讯

copyright 2016-2018 股民股票网保留所有权 京ICP备16025527号 免责声明:网站部分内容转载至网络,如有侵权请告知删除