什么是并行数据挖掘?

全部回答1
默认 最新
  • 并行数据挖掘技术不同于其它并行算法的地方在于它需要处理的数据的规模很大。在并行算法中有一点是不可取的,那就是:算法主要是把磁盘和处理器之间以及各个处理器之间的数据规模尽量减少到最小。人们知道,对于并行而言,交互之间的消耗(即内存的使用)是比执行时间(计算阶段)重要得多的因素。数据挖掘算法已经给出了一系列的例子和学习概念(使例子的特征更简单)。并且概念很容易用谓词来表示,在一些事件中,算法的目的是把这些概念嵌入到一个分类器中,决策树就是这样一个例子。而在其它的事件中,算法的目的是自己定义这些概念,因为它们提供了数据的结构。串行数据挖掘算法对于规模很小的数据也需要大量的运行时间,而且可用于分析的数据增长得很快,这样就需要寻找用于数据挖掘的并行算法,目前并行数据挖掘算法已有了充分的研究并行数据挖掘的策略一个算法的复杂性可以表示为空间复杂性和时间复杂性两个方面。并行算法的目标是尽可能减少时间复杂性,但其代价是通过增加空间复杂性(如增加空间的维数及增加处理器的台数)来实现的。从算法树的结构来看,通常的串行算法树“深而窄”;而并行算法树的结构截然不同。为了达到把时间复杂性转化为空间复杂性的目的,并行算法树采用“浅而宽”的结构即每个时刻可容纳的计算量相应增加,使整个算法的步数尽可能减少。常用的三种并行策略:朴素并行典型并行逻辑并行
    0 点赞

没有更多内容了

返回顶部
产品求购 求购