1、统计学目前有一种趋势是越来越精确。当然,这本身并不是坏事,只有越精确才能避免错误,发现真理。
统计学在采用一个方法之前先要证明,而不是像计算机科学和机器学习那样注重经验。有时候同一问题的其它领域的研究者提出一个很明显有用的方法,但它却不能被统计学家证明(或者现在还没有证明)。
统计学更倾向于经过数学证明的方法而不是一些特殊方法。但统计学的核心问题就是在观察了样本的情况下如何去推断总体。当然这也常常是大数据挖掘所关注的。
2、大数据技术作为几门学科的综合,已经从机器学习那里继承了实验的态度。这并不意味着大数据工作者不注重精确,而只是说明如果方法不能产生结果的话就会被放弃
数据挖掘的一个特定属性就是要处理的是一个大数据集。这就意味着,传统统计学由于可行性的原因,我们常常得到的只是一个样本,但是需要描述样本取自的那个大数据集。然而,数据挖掘问题常常可以得到数据总体,例如关于一个公司的所有职工数据,数据库中的所有客户资料,去年的所有业务。在这种情形下,统计学的推断就没有价值了。
想要了解更多关于大数据资讯信息,请关注中培伟业李老师二维码: