一切新事物的产生都是由需求驱动的。希望能让计算机自动智能地分析数据库中的大量数据以获取信息,是推动挖掘型工具产生并发展的强大动力。从生产成本的角度来看,公司的人上费用在不断提升,产品一与服务的价格持续下降,激烈的市场竞争迫使决策者想办法降低成本并扩大产品与服务的销售量来提高公司的竟争力。从计算机的应用角度来看,无论是硬样与网络在性能方面的提高,还是软件的技术与功能的提高,都要求软件从单纯的管理功能向综合的分析功能转变。从数据管理的角度来看,历史的数据是一笔宝贵的财富,而且这些数据正以几何级数或指数级数增长。从软件技术的发展方面来看,大数据量的分析对原来各个领域的技术带来了极大的挑战,需要采用综合性的技术来迎接这些挑战。 随着数据库技术的飞速发展以及人们获取数据手段的多样化,人类所拥有的数据急剧增加,可是目前用+对这些数据进行分析处理的工具却很少。数据库系统所能做到的只是对数据库中己有的数据进行存取和简单的操作,人们通过这些数据所获得的信息量仅仅是整个数据库所包含的信息量的很少一部分,隐藏在这些数据之后的更重要的信息是关于这些数据的整体特征的描述及对其发展趋势的预测,这些信息在决策制定的过程中具有重要的参考价值。 例如,股票经纪人需要从日积月累的大量股票行情变化的历史记录中发现其变化规律,以供预测未来趋势;超级市场的经理人员希望能够从过去几年的销售记录中分析出顾客的消费习惯和行为,以便及时变换营销策略:地质学家想通过分析地球资源卫星发回的大量数据和照片来发现有开采价值的矿物资源等。有一个很普通却很能说明数据挖掘如何产生效益的例子:美国加州某个超级连锁店通过数据挖掘,从记录着每天销售信息和顾客基本情况的数据库中发现,在下班后前来购买婴儿尿布的顾客多数是男性,而且往往也同时购买啤酒。于是这个连锁店的经理当机立断,重新布置了货架,把啤酒类商品布置在婴儿尿布货架附近,并在二者之间放上土豆之类的佐酒小食品,同时把男士们需要的日常生活用品也就近布置。这样一来,土述几种商品的销量大增。 通过上面的例子可以看出,数据挖掘能为决策者提供重要的、极有价值的信息或知识,从而产生不可估量的效益。因此,虽然数据挖掘产品尚不成熟,但其市场份额却正日益扩人,越来越多的大中型企业开始利用数据挖掘来分析公司的数据以辅助决策,数据挖掘正逐渐成为在市场竞争中立于不败之地的法宝。