问答
首页
找产品
找企业
资讯
论坛
百科
问答
维修
服务
品牌
改装
首页
问答
全部分类
问答
精选
待解决
问
数据仓库与数据挖掘的原理是什么?
匿名用户
本书全面深入地介绍了数据仓库、联机分析处理和数据挖掘的基本概念、基本原理和应用技术。全书分成三篇,数据仓库及OLAP概念、原理和技术篇的主要内容包括数据仓库的基本概念、体系结构、模型设计、创建和维护,ETL、元数据、数据集市、OLAP的基本概念、分类、模型设计;数据挖掘技术篇介绍了数据挖掘的基本理论、基本过程、常见模型的算法;工具及实例简要介绍了数据仓库产品工具的基本情况,对产品选择和评判进行了一些分析,并较详细地介绍和分析了移动通信业务数据仓库系统。 本书可作为计算机、信息系统等专业的学生学习数据仓库、OLAP及数据挖掘技术的实用教程,也可供从事数据仓库、数据挖掘研究、设计、开发等工作的科研、工程人员等。
2023-07-16
3条回答
问
数据挖掘技术中的数据预处理阶段包括哪些
匿名用户
数据挖掘是从一堆数据中找出输入与输出之间的关系,然后根据新的输入预测输出。简单举例:例如你有北京的房价数据,从1月到10月的,房子不同的面积对应不同的价格。现在到了·11月,然后有一座100平米的房子,你觉得价格应该是多少呢? 这就是从...
2023-07-15
1条回答
问
数据挖掘的本质指的是
匿名
数据挖掘利用了人工智能(AI)和统计分析的进步所带来的好处。这两门学科都致力于模式发现和预测。 数据挖掘不是为了替代传统的统计分析技术。相反,他是统计分析方法学的延伸和扩展。大多数的统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者的要求很高。而随着计算机计算能力的不断增强,我们有可能利用计算机强大的计算能力只通过相对简单和固定的方法完成同样的功能。 一些新兴的技术同样在知识发现领域取得了很好的效果,如神经元网络和决策树,在足够多的数据和计算能力下,他们几乎不用人的关照自动就能完成许多有价值的功能。 数据挖掘就是利用了统计和人工智能技术的应用程序,他把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
2023-07-15
2条回答
问
学习数据挖掘一般要学哪些软件和工具
金屋藏娇
1、WEKA WEKA 原生的非 Java 版本主要是为了分析农业领域数据而开发的。该工具基于 Java 版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与 RapidMiner 相比优势在于,它在 GNU 通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。WEKA 支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。添加序列建模后,WEKA 将会变得更强大,但目前不包括在内。2、RapidMiner 该工具是用 Java 语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。另外,除了数据挖掘,RapidMiner 还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自 WEKA(一种智能分析环境)和 R 脚本的学习方案、模型和算法。 RapidMiner 分布在 AGPL 开源许可下,可以从 SourceForge 上下载。SourceForge 是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括维基百科使用的 MediaWiki。3、NLTK 当涉及到语言处理任务,没有什么可以打败 NLTK。NLTK 提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。而您需要做的只是安装 NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用 Python 语言编写的,你可以在上面建立应用,还可以自定义它的小任务。
2023-07-15
2条回答
问
如何准备才能找到数据挖掘方向的工作
热心问友
数据挖掘人员需具备以下基本条件,才可以完成数据挖掘项目中的相关任务。一、专业技能硕士以上学历,数据挖掘、统计学、数据库相关专业,熟练掌握关系数据库技术,具有数据库系统开发经验熟练掌握常用的数据挖掘算法具备数理统计理论基础,并熟悉常用的统计工具软件二、行业知识具有相关的行业知识,或者能够很快熟悉相关的行业知识三、合作精神具有良好的团队合作精神,能够主动和项目中其他成员紧密合作四、客户关系能力具有良好的客户沟通能力,能够明确阐述数据挖掘项目的重点和难点,善于调整客户对数据挖掘的误解和过高期望具有良好的知识转移能力,能够尽快地让模型维护人员了解并掌握数据挖掘方法论及建模实施能力进阶能力要求数据挖掘人员具备如下条件,可以提高数据挖掘项目的实施效率,缩短项目周期。具有数据仓库项目实施经验,熟悉数据仓库技术及方法论熟练掌握SQL语言,包括复杂查询、性能调优熟练掌握ETL开发工具和技术熟练掌握Microsoft Office软件,包括Excel和PowerPoint中的各种统计图形技术善于将挖掘结果和客户的业务管理相结合,根据数据挖掘的成果向客户提供有价值的可行性操作方案现在,许多企业都把数据看成宝贵的财富,纷纷利用商务智能发现其中隐藏的信息,借此获得巨额的回报。国内暂时还没有官方关于数据挖掘行业本身的市场统计分析报告,但是国内数据挖掘在各个行业都有一定的研究。据国外专家预测,在今后的5—10年内,随着数据量的日益积累以及计算机的广泛应用,数据挖掘将在中国形成一个产业。众所周知,IT就业市场竞争已经相当激烈,而数据处理的核心技术---数据挖掘更是得到了前所未有的重视。数据挖掘和商业智能技术位于整个企业IT-业务构架的金字塔塔尖,目前国内数据挖掘专业的人才培养体系尚不健全,人才市场上精通数据挖掘技术、商业智能的供应量极小,而另一方面企业、政府机构和和科研单位对此类人才的潜在需求量极大,供需缺口极大。如果能将数据挖掘技术与个人已有专业知识相结合,您必将开辟职业生涯的新天地!
2023-07-15
2条回答
问
数据挖掘的未来和人工智能的前景。。。。
天使的翅膀↘
目前数据挖掘和人工智能的理论研究较多,而应用研究较少,该领域的应用前景很广阔
2023-07-14
2条回答
问
数据挖掘专业报考学校
宝宝熊
不用犹豫,一定选电子科技大学,理由如下:1、从专业性来看,电子科技大学覆盖电子科技全部领域,其电子专业与金融专业跨学科建成的电子金融学也是实用性极强的品牌优势专业,是金融企业的热招高校。2、从学校地位来说,电子科技大学是教育部直属、985、211工程重点大学,毕业前景无论是就业升学都有入门保证,能给你更多的择业机会。3、从未来经济前景看,金融固然是热门,但单纯的金融理论与应用人才已经过多,金融企业的人才需求像银行一样,开始转移到对技术创新型金融人才的需求。
2023-07-10
2条回答
问
数据挖掘兴起于哪一年
匿名
第一阶段:电子邮件阶段这个阶段可以认为是从70年代开始,平均的通讯量以每年几倍的速度增长。第二阶段:信息发布阶段从1995年起,以Web技术为代表的信息发布系统,爆炸式地成长起来,成为目前Internet的主要应用。中小企业如何把握好从“粗放型”到“精准型”营销时代的电子商务。第三阶段: EC(Electronic Commerce),即电子商务阶段EC在美国也才刚刚开始,之所以把EC列为一个划时代的东西,是因为Internet的最终主要商业用途,就是电子商务。同时反过来也可以说,若干年后的商业信息,主要是通过Internet传递。Internet即将成为我们这个商业信息社会的神经系统。1997年底在加拿大温哥华举行的第五次亚太经合组织非正式首脑会议(APEC)上美国总统克林顿提出敦促各国共同促进电子商务发展的议案,其引起了全球首脑的关注,IBM、HP和Sun等国际著名的信息技术厂商已经宣布1998年为电子商务年。第四阶段:全程电子商务阶段随着SaaS(Software as a service)软件服务模式的出现,软件纷纷登陆互联网[5],延长了电子商务链条,形成了当下最新的“全程电子商务”概念模式。也因此形成了一门独立的学科——数据挖掘与客户关系管理硕士。
2023-07-10
1条回答
问
数据挖掘有哪些工作流程
森林王
分析方法: 数据挖掘 · 分类 (Classification) · 估计(Estimation) · 预测(Prediction) · 相关性分组或关联规则(Affinity grouping or association rules) · 聚类(Clustering) · 描述和可视化(Description and Visualization) · 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等) 方法简介: ·分类 (Classification) 首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。 例子: a. 信用卡申请者,分类为低、中、高风险 b. 故障诊断:中国宝钢集团与上海天律信息技术有限公司合作,采用数据挖掘技术对钢材生产的全流程进行质量监控和分析,构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。 注意: 类的个数是确定的,预先定义好的 · 估计(Estimation) 估计与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类 数据挖掘 的类别是确定数目的,估值的量是不确定的。 例子: a. 根据购买模式,估计一个家庭的孩子个数 b. 根据购买模式,估计一个家庭的收入 c. 估计real estate的价值 一般来说,估值可以作为分类的前一...分析方法: 数据挖掘 · 分类 (Classification) · 估计(Estimation) · 预测(Prediction) · 相关性分组或关联规则(Affinity grouping or association rules) · 聚类(Clustering) · 描述和可视化(Description and Visualization) · 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等) 方法简介: ·分类 (Classification) 首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。 例子: a. 信用卡申请者,分类为低、中、高风险 b. 故障诊断:中国宝钢集团与上海天律信息技术有限公司合作,采用数据挖掘技术对钢材生产的全流程进行质量监控和分析,构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。 注意: 类的个数是确定的,预先定义好的 · 估计(Estimation) 估计与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类 数据挖掘 的类别是确定数目的,估值的量是不确定的。 例子: a. 根据购买模式,估计一个家庭的孩子个数 b. 根据购买模式,估计一个家庭的收入 c. 估计real estate的价值 一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。 · 预测(Prediction) 通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。 相关性分组或关联规则 (Affinity grouping or association rules) 决定哪些事情将一起发生。 例子: a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则) b. 客户在购买A后,隔一段时间,会购买B (序列分析) · 聚类(Clustering) 聚类是对记录分组,把相似的记录在一个聚集里。聚类和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。 例子: a. 一些特定症状的聚集可能预示了一个特定的疾病 b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群 聚集通常作为数据挖掘的第一步。例如,"哪一种类的促销对客户响应最好?",对于这一 类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。 · 描述和可视化(Description and Visualization) 是对数据挖掘结果的表示方式。一般只是指数据可视化工具,包含报表工具和商业智能分析产品(BI)的统称。譬如通过Yonghong Z-Suite等工具进行数据的展现,分析,钻取,将数据挖掘的分析结果更形象,深刻的展现出来。 挖掘分类 以上七种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘· 直接数据挖掘 目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。 间接数据挖掘 目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 。 · 分类、估值、预言属于直接数据挖掘;后四种属于间接数据挖掘
2023-07-10
2条回答
问
数据挖掘和数据仓库的关系?
匿名用户
若将Data Warehousing(数据仓库)比喻作矿坑,数据挖掘就是深入矿坑采矿的工作。毕竟数据挖掘不是一种无中生有的魔术,也不是点石成金的炼金术,若没有够丰富完整的数据,是很难期待数据挖掘能挖掘出什么有意义的信息的。要将庞大的数据转换成为有用的信息,必须先有效率地收集信息。随着科技的进步,功能完善的数据库系统就成了最好的收集数据的工具。数据仓库,简单地说,就是搜集来自其它系统的有用数据,存放在一整合的储存区内。所以其实就是一个经过处理整合,且容量特别大的关系型数据库,用以储存决策支持系统(Design Support System)所需的数据,供决策支持或数据分析使用。从信息技术的角度来看,数据仓库的目标是在组织中,在正确的时间,将正确的数据交给正确的人。许多人对于Data Warehousing和数据挖掘时常混淆,不知如何分辨。其实,数据仓库是数据库技术的一个新主题,利用计算机系统帮助我们操作、计算和思考,让作业方式改变,决策方式也跟着改变。数据仓库本身是一个非常大的数据库,它储存着由组织作业数据库 中整合而来的数据,特别是指事务处理系统OLTP(On-Line Transactional Processing)所得来的数据。将这些整合过的数据置放于数据昂哭中,而公司的决策者则利用这些数据作决策;但是,这个转换及整合数据的过程,是建立一个数据仓库最大的挑战。因为将作业中的数据转换成有用的的策略性信息是整个数据仓库的重点。综上所述,数据仓库应该具有这些数据:整合性数据(integrated data)、详细和汇总性的数据(detailed andsummarized data)、历史数据、解释数据的数据。从数据仓库挖掘出对决策有用的信息与知识,是建立数据仓库与使用数据挖掘的最大目的,两者的本质与过程是两回事。换句话说,数据仓库应先行建立完成,数据挖掘才能有效率的进行,因为数据仓库本身所含数据是干净(不会有错误的数据参杂其中)、完备,且经过整合的。因此两者关系或许可解读为数据挖掘是从巨大数据仓库中找出有用信息的一种过程与技术。
2023-06-25
2条回答
上一页
54/59
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
下一页
求购
首页
找产品
找企业
论坛
我的