数据挖掘算法的常见种类

日期: 栏目:大数据算法 阅读:0
数据挖掘算法的常见种类

数据挖掘(Data Mining)是指从大量的数据中,使用特定的算法抽取有用的信息的过程,是机器学习、统计学和数据库技术的综合衍生学科。数据挖掘可以使数据庞大的企业改善运营绩效,提升市场策略水平,促进产品开发,提高客户满意度,增加诊断效能等,在金融、电子商务、生物医学、医疗保健和制造等多个领域得到广泛应用。

常见的数据挖掘算法可分为四类:监督学习算法、无监督学习算法、半监督学习算法和强化学习算法。

(一)监督学习算法是指由明确的输出变量来预测新数据的机器学习算法,通过收集数据,然后从数据中获取规律来预测未知事物的结果。其中常见的有决策树、朴素贝叶斯、逻辑回归、K最近邻(K-NN)等。

(二)无监督学习算法是一种从样本中学习数据分布规律的算法,通过找到数据之间的关系,来探究事物的内部结构及规律,其中常见的有聚类分析、层次聚类分析、关联规则算法等。

(三)半监督学习算法是一种有监督学习与无监督学习有机结合的算法,其中样本存在一定比例的有与无的情况,这种算法的最常见使用方法是从相同样本中提取特征,然后将这些特征划分到不同特征空間,对这些特征空间利用监督学习和无监督学习技术以优化方式进行建模和预测。

(四)强化学习算法是一种允许机器学习算法以有目标地运作的机器学习技术,它是行为评估过程中从前一个行为中学习到最新行为的一种技术,其中最常见的强化学习算法是Q学习和 SARSA 算法等。

以上就是常见的数据挖掘算法的种类,它们的具体操作方式及用途也有所不同,在运用这些算法的时候,要结合不同的实际情况,功能需要,才能得到最大效果。

标签: