大数据分析及挖掘技术是一种处理和分析海量数据的技术。
首先,大数据分析是指对规模巨大的数据进行分析,这些大数据具有数据量大、速度快、类型多、价值高和真实性强的特点。大数据分析的过程包括可视化分析、数据挖掘算法、预测性分析能力、语义引擎、数据质量和数据管理等方面。
具体来说,可视化分析可以直观地展示数据,让数据自己说话;数据挖掘算法则深入数据内部,挖掘价值;预测性分析基于可视化分析和数据挖掘的结果做出预测性判断;语义引擎从“文档”中智能提取信息;数据质量和数据管理保证高质量的分析结果。
数据挖掘(Data Mining)则是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘的过程包括定义问题、数据准备、数据挖掘和结果分析。数据挖掘的对象可以是关系数据库、面向对象数据库、数据仓库、文本数据源、多媒体数据库等。
总之,大数据分析及挖掘技术是通过各种技术和方法处理和分析海量数据,提取有用信息和知识,为企业决策提供支持的过程。