大数据挖掘[编辑]
定义:大数据挖掘是指从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息技术的高速发展,人们积累的数据量急剧增长,动辄以tb计,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。
数据挖掘问题类型对应的技术:
①数据描述和汇总
②分群: 聚类、神经网路、可视化
③概念描述: 规则归纳、概念聚类
④分类: 判别分析、规则归纳、决策树、神经网络、K最近邻、基于案例的推理、遗传算法
⑤预测: 回归分析、回归树、神经网络、K最近邻、博克斯一詹金斯、遗传算法
⑥相关分析: 相关分析、回归分析、关联规则、贝叶斯网络、归纳逻辑程序设计、可视化技术
数据挖掘工具分类
数据挖掘工具根据其适用的范围分为两类:专用挖掘工具和通用挖掘工具。
1.1 专用数据挖掘工具
专用数据挖掘工具是针对某个特定领域的问题提供解决方案,在涉及算法的时候充分考虑了数据、需求的特殊性,并作了优化。对任何领域,都可以开发特定的数据挖掘工具。例如,IBM公司的AdvancedScout系统针对NBA的数据,帮助教练优化战术组合。特定领域的数据挖掘工具针对性比较强,只能用于一种应用;也正因为针对性强,往往采用特殊的算法,可以处理特殊的数据,实现特殊的目的,发现的知识可靠度也比较高。
1.2 通用数据挖掘工具
通用数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。通用的数据挖掘工具不区分具体数据的含义,采用通用的挖掘算法,处理常见的数据类型。例如,IBM公司Almaden研究中心开发的QUEST系统,SGI公司开发的MineSet系统,加拿大SimonFraser大学开发的DBMiner系统。通用的数据挖掘工具可以做多种模式的挖掘,挖掘什么、用什么来挖掘都由用户根据自己的应用来选择。
网络营销词典内容均由网友提供,仅供参考。如发现词条内容有问题,请发邮件至info # wm23.com。