问答
首页
找产品
找企业
资讯
论坛
百科
问答
维修
服务
品牌
改装
首页
问答
全部分类
问答
精选
待解决
问
数据挖掘方面的经典书籍有什么?
匿名用户
推荐两本比较基础的书,数据挖掘导论和数据挖掘。经典教材,难度不深,内容全面且讲解细致,适合初学者使用。1、数据挖掘导论,[美]Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著,译者: 范明 范宏建,人民邮电出版社;2、数据挖掘:概念与技术,作者:(加)韩家炜,堪博 著,范明,孟小峰 译,机械工业出版社;因为都是中文版,阅读起来基本没有障碍,而且这两个出版社也是计算机领域的传统出版社了,质量还是很能保证的。3、国外书籍推荐Pang-Ning Tan, Vipin Kumar etc. Introduction to Data Mining。可以深入了解数据挖掘关于分类、关联规则、聚类的知识。第一章讲基本部分,第二章讲高级部分,让人由浅入深。另有单独的一章介绍异常检测。本书的第一作者是物理背景出身,所以讲解很重视对于算法的理解(优缺点与适用范围等)。想学习数据挖掘,推荐上CDA数据分析师的课程。课程培养学员硬性的数据挖掘理论与Python数据挖掘算法技能的同时,还兼顾培养学员软性数据治理思维、商业策略优化思维、挖掘经营思维、算法思维、预测分析思维,全方位提升学员的数据洞察力。点击预约免费试听课。
2023-07-15
3条回答
问
电子政务数据挖掘有哪些主要过程
匿名
电子政务中数据挖掘概述 简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识的过程,有时也被人们称为知识挖掘、知识提取、知识发现、数据/模式分析等。它是现代数据库技术发展与人工智能(及其学习、模式识别)技术相结合的产物。在数据挖掘领域,数据挖掘功能发现的模式类别主要有关联规则、分类、聚类、概念描述和偏差检测等。这些模式也是电子政务数据挖掘所需要的。例如在税务部门可以利用数据挖掘的偏差检测,对同一类型纳税人数据进行分析挖掘,可以发现偷税漏税问题。所发现的规则模式在电子政务中的应用我们会在第4部分中详细介绍,这里不再赘述。 数据挖掘的结果就主要体现在这些模式的发现上,这是一个极其复杂的过程。其中核心的问题就是用何种方法来有效地从已知数据中挖掘知识。在电子政务中数据挖掘的常用方法主要有决策树方法、统计的方法、归纳法、神经网络方法、遗传算法、粗糙集方法、人工智能、模糊集方法等。电子政务软件金鹏信息www.jpsycn.com 电子政务中的数据挖掘是指为政府各种业务活动、工作、决策寻找知识,一般电子政务中数据挖掘的过程应该包括数据准备、挖掘处理、知识表达与解释三个阶段。数据准备是为电子政务数据挖掘提供挖掘对象的阶段。主要是针对需求分析的结果做挖掘对象的准备工作,其主要内容有数据的预处理(如抽取、转化、净化、理解等)以及建立数据挖掘处理集等。通过数据准备提高数据挖掘质量,减少数据的杂乱性、冗余性和不完整性。挖掘操作是数据挖掘的核心,主要是通过算法引擎选择挖掘算法后,对数据准备阶段建立的数据挖掘处理集进行挖掘,从中发现感兴趣的知识。表达和解释阶段是对挖掘结果进行分析,提取出最有价值的信息,以图表形式或其他可视化手段展现给用户。
2023-07-10
1条回答
问
如何通过用数据挖掘技术来分析Web网站日志
匿名用户
1、数据预处理阶段根据挖掘的目的,对原始Web日志文件中的数据进行提取、分解、合并、最后转换为用户会话文件。该阶段是Web访问信息挖掘最关键的阶段,数据预处理包括:关于用户访问信息的预处理、关于内容和结构的预处理。 2、会话识别阶段该阶段本是属于数据预处理阶段中的一部分,这里将其划分成单独的一个阶段,是因为把用户会话文件划分成的一组组用户会话序列将直接用于挖掘算法,它的精准度直接决定了挖掘结果的好坏,是挖掘过程中最重要的阶段。 3、模式发现阶段模式发现是运用各种方法和技术从Web日志数据中挖掘和发现用户使用Web的各种潜在的规律和模式。模式发现使用的算法和方法不仅仅来自数据挖掘领域,还包括机器学习、统计学和模式识别等其他专业领域。 模式发现的主要技术有:统计分析(statistical analysis)、关联规则(association rules)、聚类(clustering)、归类(classification)、序列模式(sequential patterns)、依赖关系(dependency)。 (1)统计分析(statistical analysis):常用的统计技术有:贝叶斯定理、预测回归、对数回归、对数-线性回归等。可用来分析网页的访问频率,网页的访问时间、访问路径。可用于系统性能分析、发现安全漏洞、为网站修改、市场决策提供支持。 (2)关联规则(association rules):关联规则是最基本的挖掘技术,同时也是WUM最常用的方法。在WUM中常常用在被访问的网页中,这有利于优化网站组织、网站设计者、网站内容管理者和市场分析,通过市场分析可以知道哪些商品被频繁购买,哪些顾客是潜在顾客。 (3)聚类(clustering):聚类技术是在海量数据中寻找彼此相似对象组,这些数据基于距离函数求出对象组之间的相似度。在WUM中可以把具有相似模式的用户分成组,可以用于电子商务中市场分片和为用户提供个性化服务。 (4)归类(classification):归类技术主要用途是将用户资料归入某一特定类中,它与机器学习关系很紧密。可以用的技术有:决策树(decision tree)、K-最近邻居、Naïve Bayesian classifiers、支持向量机(support vector machines)。 (5)序列模式(sequential patterns):给定一个由不同序列组成的集合,其中,每个序列由不同的元素按顺序有序排列,每个元素由不同项目组成,同时给定一个用户指定的最小支持度阈值,序列模式挖掘就是找出所有的频繁子序列,即子序列在序列集中的出现频率不低于用户指定的最小支持度阈值。 (6)依赖关系(dependency):一个依赖关系存在于两个元素之间,如果一个元素A的值可以推出另一个元素B的值,则B依赖于A。 4、模式分析阶段模式分析是Web使用挖掘最后一步,主要目的是过滤模式发现阶段产生的规则和模式,去除那些无用的模式,并把发现的模式通过一定的方法直观的表现出来。由于Web使用挖掘在大多数情况下属于无偏向学习,有可能挖掘出所有的模式和规则,所以不能排除其中有些模式是常识性的,普通的或最终用户不感兴趣的,故必须采用模式分析的方法使得挖掘出来的规则和知识具有可读性和最终可理解性。常见的模式分析方法有图形和可视化技术、数据库查询机制、数理统计和可用性分析等。
2023-07-10
1条回答
问
如何实时获取机器设备的运行状态数据?
6112ed695384
只显示开停很简单,在电机电源上并一电压传感器,将其转换为数字信号,可以8个一组,用单片机扩展技术,一个单 片机可以“同时”采集多组开停信号,并用定时器(单片机内部有)控制采集时间间隔,每次采信后由单片机通过RS232串口或以太网络接口传至上位机 ,这个单片机程序和上位机程序都比较简单
2023-06-13
5条回答
问
如何删除指纹传感器中存储的指纹数据
88330a05a7ee
你还是打800吧,这个比较难搞。我以前一个也是能等记指纹信息,就是不能用来等陆,后来去维修店看了下,是指纹识别器坏了,换个新的就行了。
2023-06-13
2条回答
问
用磁阻传感器法描绘磁场分布的数据?
bc0b5f0274f0
很明显,铁磁性物质放在磁阻传感器周围较近处,将干扰地磁场的大小,甚至干扰局部地磁场的方向,使测量结果发生异常。利用这一点可以探测铁矿。
2023-06-12
2条回答
问
命名数据网络有哪些比较好的应用
0f229ab96156
1.随着用户接入网络的物理带宽的提高,互联网应用主题已经转向文字信息和多媒体音视频等内容的获取,信息内容服务已经成为网络服务的主体。2.手机网民规模日益扩大,对移动性网络的需求在增强3.互联网应用习惯出现显著变化,包括新型即时通信(微信),微博,云视频,云存储等在内的新兴互联网内容应用迅速扩散,说明用户越来越依赖互联网来进行内容的传播和分发,对于内容共享需求日益强烈。二.TCP/IP协议1.目的在两个实体之间端到端的数字数据交换2.优势在数据帧的设计上简单,标准统一,兼容异构的网络互联互通,良好的破坏恢复机制,低数据开销3.问题(1)安全性基于IP网络安全需要对终端和连接同时信任。IP网络接受任何人发送的任何内容,不管数据包的内容,只要发送者看似合法,这种情况导致恶意信息发送到接收者,这是IP网站容易被攻击的根源。(2)移动性和多网址IP地址网络层寻址器和传输层定位标识符的双重作用限制了移动性和多网址的灵活性。特别是,传输协议绑定地址以确定通信会话,如果地址变化就会中断会话,需要重新建立连接。这种语义重载又导致IP网络中不允许存在回路,也不能同一时刻具有多个网络地址。(3)组播传输IP组播协议是事后添加到原有的点对点通信模型,以提供将信息发送到一组接收者的能力,然而因为其拓展性方面的缺点,组播从未在局域网之外的环境中大规模使用过。(4)可拓展性和服务质量的保证(5)资源浪费互联网上发生了大量的重复冗余传输(6)带宽竞争和拥塞会导致骨干网压力,网络出入口压力大针对TCP/IP网络的这些问题,NDN做出如下的改进或者革命(其实NDN的提出是想要替代IP网络的主体地位)
2023-06-12
2条回答
问
什么是以数据为中心 路由协议
00efe8f8a313
以数据为中心。传统的路由协议通常以地址作为节点的标识和路由的依据,而无线传感器网络中大量节点随机部署,所关注的是监测区域的感知数据,而不是具体哪个节点获取的信息,不依赖于全网惟一的标识。传感器网络通常包含多个传感器节点到少数基站的数据流,按照对感知数据的需求、数据通信模式和流向等,以数据为中心形成消息的转发路径。
2023-06-12
1条回答
问
分布式传感数据采集方法有哪些
698d342bf440
传感网 传感网 定义:随机分布的集成有传感器、数据处理单元和通信单元的微小节点,通过自组织的方式构成的无线网络。 功能:借助于节点中内置的传感器测量周边环境中的热、红外、声纳、雷达和地震波信号,从而探测包括温度、湿度、噪声、光强度、压力、土壤成分、移动物体的大小、速度和方向等物质现象。 以互联网为代表的计算机网络技术是二十世纪计算机科学的一项伟大成果,它给我们的生活带来了深刻的变化,然而在目前,网络功能再强大,网络世界再丰富,也终究是虚拟的,它与我们所生活的现实世界还是相隔的,在网络世界中,很难感知现实世界,很多事情还是不可能的,时代呼唤着新的网络技术。传感网络正是在这样的背景下应运而生的全新网络技术,它综合了传感器、低功耗、通讯以及微机电等等技术,可以预见,在不久的将来,传感网络将给我们的生活方式带来革命性的变化。 无线传感网 无线传感网络技术是典型的具有交叉学科性质的军民两用战略高技术,可以广泛应用于GF军事、国家安全、环境科学、交通管理、灾害预测、医疗卫生、制造业、城市信息化建设等领域。无线传感器网络(WSNs)是由许许多多功能相同或不同的无线传感器节点组成,每一个传感器节点由数据采集模块(传感器、A/D转换器)、数据处理和控制模块(微处理器、存储器)、通信模块(无线收发器)和供电模块(电池、DC/AC能量转换器)等组成。近期微电子机械加工(MEMS)技术的发展为传感器的微型化提供了可能
2023-06-12
1条回答
问
惯性传感器原始数据为什么要滤波
8dde1ee03cc7
几乎所有的传感器都需要滤波,因为这些传感器中会参杂很多别的信号,比如磁场,抖动之类的自然的或人为不可避免的信号,这些都要滤掉,便于结果分析
2023-06-12
2条回答
上一页
81/90
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
下一页
求购
首页
找产品
找企业
论坛
我的