通过数据分析找到其中的规律,来指导业务,数据挖掘的核心是挖掘数据的商业价值。下面我们来看看数据挖掘的十大经典算法及主要特点。
1、C4.5
分类决策树算法,选择一个好的特征以及分裂点作为当前节点的分类条件。
2、Naive Bayes
统计分类算法,利用概率统计知识进行分类的统计学分类方法
3、SVM
有监督的分类算法,机器学习领域中最常用,广泛应用于分类和回归问题
4、KNN
K最近邻分类算法,如果样本的K个最相似邻居属于某类别,则该样本也属于这个类别
5、Adaboost
迭代算法,针对某一训练集训练不同的弱分类器,再把这些弱分类器集合构成一个强分类器
6、CART
分类与回归树算法,先生成决策树,然后进行剪枝
7、K-Means
聚类算法,生成指定K个类,把每个对象分配给距离最近的聚类中心
8、EM
最大期望算法,在概率模型中寻找参数最大似然估计的算法
9、Apriori
挖掘潜在关联关系的算法,采用了逐层搜索的迭代的方法
10、PageRank
网页排名算法,根据网站的内外部链接的数量和质量,衡量网站的价值