问答
首页
找产品
找企业
资讯
论坛
百科
问答
维修
服务
品牌
改装
首页
问答
全部分类
问答
精选
待解决
问
是什么激发了数据挖掘的产生
旭日
一切新事物的产生都是由需求驱动的。希望能让计算机自动智能地分析数据库中的大量数据以获取信息,是推动挖掘型工具产生并发展的强大动力。从生产成本的角度来看,公司的人上费用在不断提升,产品一与服务的价格持续下降,激烈的市场竞争迫使决策者想办法降低成本并扩大产品与服务的销售量来提高公司的竟争力。从计算机的应用角度来看,无论是硬样与网络在性能方面的提高,还是软件的技术与功能的提高,都要求软件从单纯的管理功能向综合的分析功能转变。从数据管理的角度来看,历史的数据是一笔宝贵的财富,而且这些数据正以几何级数或指数级数增长。从软件技术的发展方面来看,大数据量的分析对原来各个领域的技术带来了极大的挑战,需要采用综合性的技术来迎接这些挑战。 随着数据库技术的飞速发展以及人们获取数据手段的多样化,人类所拥有的数据急剧增加,可是目前用+对这些数据进行分析处理的工具却很少。数据库系统所能做到的只是对数据库中己有的数据进行存取和简单的操作,人们通过这些数据所获得的信息量仅仅是整个数据库所包含的信息量的很少一部分,隐藏在这些数据之后的更重要的信息是关于这些数据的整体特征的描述及对其发展趋势的预测,这些信息在决策制定的过程中具有重要的参考价值。 例如,股票经纪人需要从日积月累的大量股票行情变化的历史记录中发现其变化规律,以供预测未来趋势;超级市场的经理人员希望能够从过去几年的销售记录中分析出顾客的消费习惯和行为,以便及时变换营销策略:地质学家想通过分析地球资源卫星发回的大量数据和照片来发现有开采价值的矿物资源等。有一个很普通却很能说明数据挖掘如何产生效益的例子:美国加州某个超级连锁店通过数据挖掘,从记录着每天销售信息和顾客基本情况的数据库中发现,在下班后前来购买婴儿尿布的顾客多数是男性,而且往往也同时购买啤酒。于是这个连锁店的经理当机立断,重新布置了货架,把啤酒类商品布置在婴儿尿布货架附近,并在二者之间放上土豆之类的佐酒小食品,同时把男士们需要的日常生活用品也就近布置。这样一来,土述几种商品的销量大增。 通过上面的例子可以看出,数据挖掘能为决策者提供重要的、极有价值的信息或知识,从而产生不可估量的效益。因此,虽然数据挖掘产品尚不成熟,但其市场份额却正日益扩人,越来越多的大中型企业开始利用数据挖掘来分析公司的数据以辅助决策,数据挖掘正逐渐成为在市场竞争中立于不败之地的法宝。
2023-07-16
1条回答
问
什么是数据挖掘技术
fcglcfgh19ny
http://www.dmgroup.org.cn/ 可以上这里看看,会有你要的答案的。 数据挖掘对工作的帮助有时候真的很大的。
2023-07-15
1条回答
问
什么叫做数据挖掘?
木有想法
数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。 并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。
2023-07-15
1条回答
问
数据挖掘是做什么的
傲笑江湖
数据挖掘(Data Mining)的定义是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。数据挖掘能做以下七种不同事情: · 分类 (Classification) · 估计(Estimation) · 预测(Prediction) · 相关性分组或关联规则(Affinity grouping or association rules) · 聚类(Clustering) · 描述和可视化(Description and Visualization) · 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)
2023-07-15
3条回答
问
如何组建数据挖掘团队
┕渲染、偽裝的苦澀┑
数据挖掘是团队行动。取决于企业数据挖掘活动的深度和广度,数据挖掘团队可以有不同的组织形式和不同的附属关系。单独成立一个数据挖掘部门,支持整个企业的数据分析需要是一种形式。也可以在最需要数据挖掘的业务领域内设立。例如银行系统利用数据挖掘最多的领域是信用卡销售,就可以在信用卡发行部门下面单独设立一个决策支持部。还可以把数据挖掘和营销策划结合在一起,成立策划分析部,或客户知识部。但数据挖掘不宜和数据管理以及数据库开发部门捆在一起。后者属于IT范畴,而前者和营销,和客户管理的关系更紧密。数据挖掘部门或小组的领导人是数据挖掘团队的灵魂。好的人选不必是技术专家,但要有相当的数据库使用经验和对挖掘技术的了解。更重要的是,数据挖掘部门经理应该有开拓力,组织力和沟通能力。开拓,指主动提供咨询和建议,把数据挖掘这个产品“销售”给企业内其他部门,拿到项目“订单”。在很大程度上,一个企业数据挖掘开展的广度和深度,取决于有没有这样一个有开拓性的数据挖掘部门经理。这个人参加企业决策的机会越多,数据挖掘就越可能得到管理高层的认同,数据挖掘就越可能在企业内各个领域得到推广。开拓需要洞察力,需要捕捉蕴藏在营销业务中的数据挖掘机会,善于发现当前营销活动中的盲点和“黑洞”,看到数据挖掘对提高决策效率的可能。要做到这一点,没有营销背景,没有对产品,市场,客户的了解和相当的数据挖掘应用经验,是不可能的。洞察力还包括和技术的发展保持同步,对数据挖掘新技术和新的应用有敏锐的感觉和价值判断,对企业数据挖掘能力建设有明确目标和长程视野。部门经理需要掌握全局,组织和实施数据挖掘项目,对项目起到把关作用。数据挖掘部门经理还是连通数据分析部门和营销业务部门之间的桥梁:他一方面需要把数据挖掘和分析技术以通俗的语言和浅白的逻辑介绍给非专业的营销人员,讲解数据挖掘对营销的意义,和营销部门一起把数据分析的结果提炼为具体行动方案。另一方面,根据营销战略,营销目标部署数据挖掘和技术开发,引导技术人员跳出专业局限,从营销操作和盈利的角度考虑问题和分析数据。数据挖掘团队中的其他人员首先是能够动手做项目的数据挖掘专家。对专家如何界定是一个比较困难的问题。什么是专家,用什么标准来评判?是学历,经验,还是知识面?笔者认为经验的重要性胜于学历。因为企业的数据挖掘专家不是完全能够从学校培养出来的,对于有定量分析知识,但没有真刀实枪的做过,没有放在营销环境下考验过的人才,企业要承担较大的风险。但是这不是绝对的。对有余力支持数据挖掘研究,或需要开发企业专用的数据挖掘模块和软件的单位来说,注重学历又是可行的。因为需要应选人员有较深的理论基础和较新的知识结构。这种企业往往是大企业和对数据挖掘要求较高的企业。经验,学历都还不足以反映企业对数据挖掘人才的期望,还有很多“素质”方面的要求,而这些潜在的东西,往往是决定企业对你的工作是否满意的决定性因素。首先,企业需要的数据挖掘人员需要有解决问题的能力。这是一种和学历,经验不完全相关的综合能力,包括能够迅速抓住问题的实质,判断问题的难点,提出有效的解决方案,在信息不完整甚至冲突的情况下做出结论。不论你的算法知识再多,做过的项目再多,缺乏分析和解决问题的能力,就不能说是一个合格的数据挖掘专家。在笔者多年的工作经验中,接触到很多这样缺乏解决问题能力的专才。技术上很过硬,但就是问题问不到点子上,回答不得要领。由此带来的问题是无法统领和管理数据挖掘项目,不容易为营销部门所依赖,起到咨询顾问的作用。其次是对细节的关注能力。一个典型的数据挖掘过程包括数据清洗,准备,建模,检验,和投放等若干个步骤,其中涉及许许多多的细节,任一疏忽都可能对数据挖掘的最终结果带来影响。没有对细节孜孜以求,不放过任一个疑问的态度,就不免会在数据挖掘过程中出现纰漏,影响到结果的准确和可操作性。对细节的关注也反映了人的思维是否慎密和严紧,能够发现漏洞或问题。从另一个角度阐述,数据挖掘人员需要对数据有很强的敏感度。对数据的异常,结果的异常能够及时反应,进行补救。良好的沟通能力,包括说和写,是数据挖掘人员必备的基本素质。只能动手做模型,不能动口讲模型,把数据挖掘结果用通俗的语言和形象的表达方式解释给没有技术背景的听众,使大家能够理解你的模型,了解模型的营销意义,还不是一个合格的数据挖掘专家。有营销知识。企业需要的是解决营销难题的人才,能够从数据中找出创造性的解决方案。对于数据挖掘人员来说,仅仅知道如何进行数据挖掘是不够的,还必须知道什么时候,什么情况下进行数据挖掘,对于从学校刚刚毕业的数据挖掘人员来说,这一点只有从实践中才能学到。数据挖掘人员对产品,销售,营销,服务了解得越多,就越可能发展出适合企业需要的模型。这里涉及到几个方面:一是对数据的熟悉程度。数据虽然是死的,但每个数据项目都有特定的收集渠道,内容,和背景。没有这方面的知识,你很可能拾取了有问题的数据,或漏掉了重要的数据,以致得到错误的模型。其次,缺乏对营销业务和规律的了解会影响模型的可操作性。常常的情况是,数据挖掘人员找到了一种很好的算法,确实能够提高挖掘精度。但是模型做出来以后,才发现由于没有考虑到使用方面的细节,在数据库上投放这个模型不现实,或是成本过高以致难以实行,结果是不得不推倒重来。如果对营销业务流程有足够的了解,就不会犯这样的错误。另外,提高业务素养也是交流的需要。了解业务有助于你和营销人员取得共同语言,思路相通。这样不仅有利于解绎数据挖掘结果,也有助于发现数据挖掘需求。由于数据挖掘技术在不断更新,数据结构和内容在不断深化,固步自封不能适应不断发展的营销活动的需要。数据挖掘人员要有对新技术的渴望、与技术发展保持同步的动力。汲取新知识的有效途径是参加各种培训。可能的话,通过考核拿取证书。这不仅保障自己对企业的价值,也有助于企业数据挖掘技术水平的整体进步。除了管理人员和数据挖掘专家外,数据挖掘团队内还应该配备市场分析人员。这方面熟悉计算机编程的毕业生或员工是很好的人选。市场分析人员担负着多方面的职能,包括挖掘项目的数据准备,模型的投放和追踪检测,营销数据的规范分析,等等。这些人主要支持企业日常营销运作对数据和分析的需求,把数据挖掘人员从日常的重复的分析中解放出来。从效益角度考虑,如此配置挖掘团队也可以减少数据挖掘的人力成本。
2023-07-15
1条回答
问
数据挖掘前景如何
不抛弃
曾经有一个国外的一个预测,说未来改变世界的十大技术,其中有一个是数据挖掘。这个就足够告诉你前景如何了。
2023-07-10
3条回答
问
数据挖掘部是做什么的?
匿名
分析方法: 数据挖掘· 分类 (Classification)· 估计(Estimation)· 预测(Prediction)· 相关性分组或关联规则(Affinity grouping or association rules)· 聚类(Clustering)· 描述和可视化(Description and Visualization)· 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)方法简介:·分类 (Classification)首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。例子:a. 信用卡申请者,分类为低、中、高风险b. 故障诊断:中国宝钢集团与上海天律信息技术有限公司合作,采用数据挖掘技术对钢材生产的全流程进行质量监控和分析,构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。注意: 类的个数是确定的,预先定义好的· 估计(Estimation)估计与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类 数据挖掘的类别是确定数目的,估值的量是不确定的。例子:a. 根据购买模式,估计一个家庭的孩子个数b. 根据购买模式,估计一个家庭的收入c. 估计real estate的价值一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。· 预测(Prediction)通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。相关性分组或关联规则(Affinity grouping or association rules)决定哪些事情将一起发生。例子:a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则)b. 客户在购买A后,隔一段时间,会购买B (序列分析)· 聚类(Clustering)聚类是对记录分组,把相似的记录在一个聚集里。聚类和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。例子:a. 一些特定症状的聚集可能预示了一个特定的疾病b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群聚集通常作为数据挖掘的第一步。例如,"哪一种类的促销对客户响应最好?",对于这一 类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。· 描述和可视化(Description and Visualization)是对数据挖掘结果的表示方式。一般只是指数据可视化工具,包含报表工具和商业智能分析产品(BI)的统称。譬如通过Yonghong Z-Suite等工具进行数据的展现,分析,钻取,将数据挖掘的分析结果更形象,深刻的展现出来。挖掘分类以上七种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘·直接数据挖掘目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。间接数据挖掘目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 。· 分类、估值、预言属于直接数据挖掘;后四种属于间接数据挖掘
2023-07-10
2条回答
问
数据挖掘的起源
匿名
需要是发明之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。数据挖掘利用了来自如下一些领域的思想:(1) 来自统计学的抽样、估计和假设检验,(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能(并行)计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。
2023-07-10
2条回答
问
Web数据挖掘的方法?
匿名用户
(1)协同过滤:协同过滤技术采用最近邻技术,利用客户的历史、喜好信息计算用户之间的距离,目标客户对特点商品的喜好程度由最近邻居对商品的评价的加权平均值来计算。(2)关联规则:关联规则是寻找在同一个事件中出现的不同项的相关性,用数学模型来描述关联规则发现的问题:x=>y的蕴含式,其中x,y为属性——值对集(或称为项目集),且X∩Y空集。在数据库中若S%的包含属性——值对集X的事务也包含属性——值集Y,则关联规则X=>Y的置信度为C%。3)Web日志的聚类算法:聚类分析是把具有相似特征的用户或数据项归类,在网站管理中通过聚类具有相似浏览行为的用户。基于模糊理论的Web页面聚类算法与客户群体聚类算法的模糊聚类定义相同,客户访问情况可用URL(Uj)表示。有Suj={(Ci,fSuj(Ci))|Ci∈C},其中fSuj(Ci)→[0,1]是客户Ci和URL(Uj)间的关联度:式中m为客户的数量,hits(Ci)表示客户Ci访问URL(Uj)的次数。利用Suj和模糊理论中的相似度度量Sfij定义建立模糊相似矩阵,再根据相似类[Xi]R的定义构造相似类,合并相似类中的公共元素得到的等价类即为相关Web页面。(4)序列分析:序列模式分析和关联分析类似,其目的也是为了挖掘数据之间的联系,但序列模式分析的侧重点在于分析数据间的前后序关系。它能发现数据库中如“在某一段时间内,客户购买商品A,接着会购买商品B,尔后又购买商品C,即序列A→B→C出现的频率高”之类的信息。序列模式描述的问题是:在给定的交易序列数据库中,每个序列按照交易的时间排列的一组交易集,挖掘序列函数作用是返回该数据库中高频率出现有序列。
2023-06-25
1条回答
问
什么叫做数据挖掘呢?
期待美好
数据挖掘(Data Mining)是通过分析每个数据,从大量数据中寻找其规律的技术,主要有数据准备、规律寻找和规律表示3个步骤。数据挖掘的任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。
2023-06-25
3条回答
上一页
43/59
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
下一页
求购
首页
找产品
找企业
论坛
我的