精选文章

机器学习到底有多有趣?这么多人对它爱如珍宝

2019-02-15 17:01:03 | 来源:中培企业IT培训网

如果说在科技圈你不懂“机器学习”,那你就out了。当人们在谈论机器学习时你却插不上话?怎么办?你是否厌倦了总是在与小伙伴的对话中点头?让我们来做一些改变吧。

机器学习是什么?简单地说,就是有一些通用算法可以告诉你一些关于数据集的有趣信息,而不需要写代码、编程序,只要把数据交给泛型算法,就能根据数据构建自己的逻辑。

比如说,一种算法是分类算法。它可以将数据分成不同的组。用于识别手写数字的相同分类算法也可以用于将电子邮件分为有用邮件和无用邮件,而无需更改一行代码。两者使用的是同一种泛型算法,提供的是不同的训练数据,因此产出不同的分类逻辑。

这种机器学习算法就像一个黑匣子,可以重复用于许多不同的分裂问题。

当然,“机器学习”是一个呈伞状结构的体系,除了分类算法以外,还覆盖了各种各样其他的泛型算法。

两类机器学习算法

你可以暂时将机器学习算法归为两大类:监督学习和无监督学习。区别很简单,但其重要性是不可忽视的。

监督学习

假设你是一名房地产经纪人,您的业务正在增长,所以您必须雇一批实习代理帮忙。但有一个问题,您可以看一眼房子,就能知道房子大概的价值,但是您雇来的实习代理没有您的经验,所以他们不知道如何定价房子。

为了帮助他们,您编写了一个应用程序,这个程序可以根据房子的大小、周边的环境等来估算您所在地区房子的价值。所以每当有人在您所在的城市卖掉一个房子后,您都记录下来。持续3个月,将获得很多有用信息,如:卧室数量、平方尺寸、周边环境等等,最重要的是您写下最终的销售价格。

这就是我们的“训练数据”。根据这些数据,便可以来预测其他房屋的价格。这种模式就叫做“监督学习”。

无监督学习

让我们回到前面提到的房地产经济人的例子。如果就连房地产经纪人都不知道每个房子的销售价格怎么办?即使只知道房子的大小、位置等也是可以有所作为的。这被称为无监督学习。

事实上,随着算法变得更好,无监督学习变得越来越重要,因为它可以在不必用正确答案标记数据的情况下使用。当然,还有很多其他类型的机器学习算法。

但我们要清楚的是,机器学习只能够解决数据问题,所以您要确保您输入的数据信息对解决问题是有帮助的。倘若一个问题人类专家不能手动用数据解决,计算机可能也不能解决。然而,对于那些人类能够解决的问题,如果计算机能够更快地解决,那岂不美哉?

想了解更多IT资讯,请访问中培伟业官网:中培伟业

标签: 机器学习