数据挖掘(data mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。数据挖掘能做以下七种不同事情: · 分类 (classification) · 估计(estimation) · 预测(prediction) · 相关性分组或关联规则(affinity grouping or association rules) · 聚类(clustering) · 描述和可视化(description and visualization) · 复杂数据类型挖掘(text, web ,图形图像,视频,音频等)