大数据

数据挖掘的十大经典算法及主要特点

2024-03-20 11:10:11 | 来源:企业IT培训

通过数据分析找到其中的规律,来指导业务,数据挖掘的核心是挖掘数据的商业价值。下面我们来看看数据挖掘的十大经典算法及主要特点。

1、C4.5

分类决策树算法,选择一个好的特征以及分裂点作为当前节点的分类条件。

2、Naive Bayes

统计分类算法,利用概率统计知识进行分类的统计学分类方法

3、SVM

有监督的分类算法,机器学习领域中最常用,广泛应用于分类和回归问题

4、KNN

K最近邻分类算法,如果样本的K个最相似邻居属于某类别,则该样本也属于这个类别

5、Adaboost

迭代算法,针对某一训练集训练不同的弱分类器,再把这些弱分类器集合构成一个强分类器

6、CART

分类与回归树算法,先生成决策树,然后进行剪枝

7、K-Means

聚类算法,生成指定K个类,把每个对象分配给距离最近的聚类中心

8、EM

最大期望算法,在概率模型中寻找参数最大似然估计的算法

9、Apriori

挖掘潜在关联关系的算法,采用了逐层搜索的迭代的方法

10、PageRank

网页排名算法,根据网站的内外部链接的数量和质量,衡量网站的价值