问答
首页
找产品
找企业
资讯
论坛
百科
问答
维修
服务
品牌
改装
首页
问答
全部分类
问答
精选
待解决
问
概述数据挖掘和常用的方法有那些
匿名用户
数据挖掘中常用的统计方法一共有以下几种:传统的统计方法包括回归分析、主成分分析、聚类分析、非机器学习方法:模糊集、粗糙集、支持向量机来源:数据堂 ....
2023-07-15
1条回答
问
数据挖掘的本质指的是
匿名
数据挖掘利用了人工智能(AI)和统计分析的进步所带来的好处。这两门学科都致力于模式发现和预测。 数据挖掘不是为了替代传统的统计分析技术。相反,他是统计分析方法学的延伸和扩展。大多数的统计分析技术都基于完善的数学理论和高超的技巧,预测的准确度还是令人满意的,但对使用者的要求很高。而随着计算机计算能力的不断增强,我们有可能利用计算机强大的计算能力只通过相对简单和固定的方法完成同样的功能。 一些新兴的技术同样在知识发现领域取得了很好的效果,如神经元网络和决策树,在足够多的数据和计算能力下,他们几乎不用人的关照自动就能完成许多有价值的功能。 数据挖掘就是利用了统计和人工智能技术的应用程序,他把这些高深复杂的技术封装起来,使人们不用自己掌握这些技术也能完成同样的功能,并且更专注于自己所要解决的问题。 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。
2023-07-15
2条回答
问
学习数据挖掘一般要学哪些软件和工具
金屋藏娇
1、WEKA WEKA 原生的非 Java 版本主要是为了分析农业领域数据而开发的。该工具基于 Java 版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与 RapidMiner 相比优势在于,它在 GNU 通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。WEKA 支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。添加序列建模后,WEKA 将会变得更强大,但目前不包括在内。2、RapidMiner 该工具是用 Java 语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。另外,除了数据挖掘,RapidMiner 还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自 WEKA(一种智能分析环境)和 R 脚本的学习方案、模型和算法。 RapidMiner 分布在 AGPL 开源许可下,可以从 SourceForge 上下载。SourceForge 是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括维基百科使用的 MediaWiki。3、NLTK 当涉及到语言处理任务,没有什么可以打败 NLTK。NLTK 提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。而您需要做的只是安装 NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用 Python 语言编写的,你可以在上面建立应用,还可以自定义它的小任务。
2023-07-15
2条回答
问
数据挖掘的未来和人工智能的前景。。。。
天使的翅膀↘
目前数据挖掘和人工智能的理论研究较多,而应用研究较少,该领域的应用前景很广阔
2023-07-14
2条回答
问
数据挖掘有哪些工作流程
森林王
分析方法: 数据挖掘 · 分类 (Classification) · 估计(Estimation) · 预测(Prediction) · 相关性分组或关联规则(Affinity grouping or association rules) · 聚类(Clustering) · 描述和可视化(Description and Visualization) · 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等) 方法简介: ·分类 (Classification) 首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。 例子: a. 信用卡申请者,分类为低、中、高风险 b. 故障诊断:中国宝钢集团与上海天律信息技术有限公司合作,采用数据挖掘技术对钢材生产的全流程进行质量监控和分析,构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。 注意: 类的个数是确定的,预先定义好的 · 估计(Estimation) 估计与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类 数据挖掘 的类别是确定数目的,估值的量是不确定的。 例子: a. 根据购买模式,估计一个家庭的孩子个数 b. 根据购买模式,估计一个家庭的收入 c. 估计real estate的价值 一般来说,估值可以作为分类的前一...分析方法: 数据挖掘 · 分类 (Classification) · 估计(Estimation) · 预测(Prediction) · 相关性分组或关联规则(Affinity grouping or association rules) · 聚类(Clustering) · 描述和可视化(Description and Visualization) · 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等) 方法简介: ·分类 (Classification) 首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。 例子: a. 信用卡申请者,分类为低、中、高风险 b. 故障诊断:中国宝钢集团与上海天律信息技术有限公司合作,采用数据挖掘技术对钢材生产的全流程进行质量监控和分析,构建故障地图,实时分析产品出现瑕疵的原因,有效提高了产品的优良率。 注意: 类的个数是确定的,预先定义好的 · 估计(Estimation) 估计与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类 数据挖掘 的类别是确定数目的,估值的量是不确定的。 例子: a. 根据购买模式,估计一个家庭的孩子个数 b. 根据购买模式,估计一个家庭的收入 c. 估计real estate的价值 一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。 · 预测(Prediction) 通常,预测是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。 相关性分组或关联规则 (Affinity grouping or association rules) 决定哪些事情将一起发生。 例子: a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则) b. 客户在购买A后,隔一段时间,会购买B (序列分析) · 聚类(Clustering) 聚类是对记录分组,把相似的记录在一个聚集里。聚类和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。 例子: a. 一些特定症状的聚集可能预示了一个特定的疾病 b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群 聚集通常作为数据挖掘的第一步。例如,"哪一种类的促销对客户响应最好?",对于这一 类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。 · 描述和可视化(Description and Visualization) 是对数据挖掘结果的表示方式。一般只是指数据可视化工具,包含报表工具和商业智能分析产品(BI)的统称。譬如通过Yonghong Z-Suite等工具进行数据的展现,分析,钻取,将数据挖掘的分析结果更形象,深刻的展现出来。 挖掘分类 以上七种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘· 直接数据挖掘 目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。 间接数据挖掘 目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 。 · 分类、估值、预言属于直接数据挖掘;后四种属于间接数据挖掘
2023-07-10
2条回答
问
如何进行空间数据挖掘
沉默女孩
1. 基于概率论的方法。这是一种通过计算不确定性属性的概率来挖掘空间知识的方法,所发现的知识通常被表示成给定条件下某一假设为真的条件概率。在用误差矩阵描述遥感分类结果的不确定性时,可以用这种条件概率作为背景知识来表示不确定性的置信度。 2. 空间分析方法。指采用综合属性数据分析、拓扑分析、缓冲区分析、密度分析、距离分析、叠置分析、网络分析、地形分析、趋势面分析、预测分析等在内的分析模型和方法,用以发现目标在空间上的相连、相邻和共生等关联规则,或挖掘出目标之间的最短路径、最优路径等知识。目前常用的空间分析方法包括探测性的数据分析、空间相邻关系挖掘算法、探测性空间分析方法、探测性归纳学习方法、图像分析方法等。 3. 统计分析方法。指利用空间对象的有限信息和/或不确定性信息进行统计分析,进而评估、预测空间对象属性的特征、统计规律等知识的方法。它主要运用空间自协方差结构、变异函数或与其相关的自协变量或局部变量值的相似程度实现包含不确定性的空间数据挖掘。 4. 归纳学习方法。即在一定的知识背景下,对数据进行概括和综合,在空间数据库(数据仓库)中搜索和挖掘一般的规则和模式的方法。归纳学习的算法很多,如由Quinlan提出的著名的C5.0决策树算法、Han Jiawei教授等提出的面向属性的归纳方法、裴健等人提出的基于空间属性的归纳方法等。 5. 空间关联规则挖掘方法。即在空间数据库(数据仓库)中搜索和挖掘空间对象(及其属性)之间的关联关系的算法。最著名的关联规则挖掘算法是Agrawal提出的Apriori算法;此外还有程继华等提出的多层次关联规则的挖掘算法、许龙飞等提出的广义关联规则模型挖掘方法等。 6. 聚类分析方法。即根据实体的特征对其进行聚类或分类,进而发现数据集的整个空间分布规律和典型模式的方法。常用的聚类方法有K-mean, K-medoids方法、Ester等提出的基于R—树的数据聚焦法及发现聚合亲近关系和公共特征的算法、周成虎等提出的基于信息熵的时空数据分割聚类模型等。 7. 神经网络方法。即通过大量神经元构成的网络来实现自适应非线性动态系统,并使其具有分布存储、联想记忆、大规模并行处理、自学习、自组织、自适应等功能的方法;在空间数据挖掘中可用来进行分类和聚类知识以及特征的挖掘。 8. 决策树方法。即根据不同的特征,以树型结构表示分类或决策集合,进而产生规则和发现规律的方法。采用决策树方法进行空间数据挖掘的基本步骤如下:首先利用训练空间实体集生成测试函数;其次根据不同取值建立决策树的分支,并在每个分支子集中重复建立下层结点和分支,形成决策树;然后对决策树进行剪枝处理,把决策树转化为据以对新实体进行分类的规则。 9. 粗集理论。一种由上近似集和下近似集来构成粗集,进而以此为基础来处理不精确、不确定和不完备信息的智能数据决策分析工具,较适于基于属性不确定性的空间数据挖掘。 10. 基于模糊集合论的方法。这是一系列利用模糊集合理论描述带有不确定性的研究对象,对实际问题进行分析和处理的方法。基于模糊集合论的方法在遥感图像的模糊分类、GIS模糊查询、空间数据不确定性表达和处理等方面得到了广泛应用。 11. 空间特征和趋势探侧方法。这是一种基于邻域图和邻域路径概念的空间数据挖掘算法,它通过不同类型属性或对象出现的相对频率的差异来提取空间规则。 12. 基于云理论的方法。云理论是一种分析不确定信息的新理论,由云模型、不确定性推理和云变换三部分构成。基于云理论的空间数据挖掘方法把定性分析和定量计算结合起来,处理空间对象中融随机性和模糊性为一体的不确定性属性;可用于空间关联规则的挖掘、空间数据库的不确定性查询等。 13. 基于证据理论的方法。证据理论是一种通过可信度函数(度量已有证据对假设支持的最低程度)和可能函数(衡量根据已有证据不能否定假设的最高程度)来处理不确定性信息的理论,可用于具有不确定属性的空间数据挖掘。 14. 遗传算法。这是一种模拟生物进化过程的算法,可对问题的解空间进行高效并行的全局搜索,能在搜索过程中自动获取和积累有关搜索空间的知识,并可通过自适应机制控制搜索过程以求得最优解。空间数据挖掘中的许多问题,如分类、聚类、预测等知识的获取,均可以用遗传算法来求解。这种方法曾被应用于遥感影像数据中的特征发现。 15. 数据可视化方法。这是一种通过可视化技术将空间数据显示出来,帮助人们利用视觉分析来寻找数据中的结构、特征、模式、趋势、异常现象或相关关系等空间知识的方法。为了确保这种方法行之有效,必须构建功能强大的可视化工具和辅助分析工具。 16. 计算几何方法。这是一种利用计算机程序来计算平面点集的Voronoi图,进而发现空间知识的方法。利用Voronoi图可以解决空间拓扑关系、数据的多尺度表达、自动综合、空间聚类、空间目标的势力范围、公共设施的选址、确定最短路径等问题。 17. 空间在线数据挖掘。这是一种基于网络的验证型空间来进行数据挖掘和分析的工具。它以多维视图为基础,强调执行效率和对用户命令的及时响应,一般以空间数据仓库为直接数据源。这种方法通过数据分析与报表模块的查询和分析工具(如OLAP、决策分析、数据挖掘等)完成对信息和知识的提取,以满足决策的需要。
2023-06-25
2条回答
问
汽车电脑检测的标准数据流是什么
228277e85422
进气压力传感器(MAP):提供一个信号给电脑ECU,ECU将其值通过计算后直接输出,并且随进气管内真空度的不同,其输出值也不同,其范围一般在0~5.12V、0~255kPa或0~75.3in.Hg。2.空气流量计(MAF):提供一个信号给汽车电脑ECU,ECU将其值通过计算后或直接输出,从而反映总的进气量,并随进气量的不同输出值也不同。其范围一般在 0~500g/s、0~5V、0~625ms或0—1600Hz。3.冷却液温度传感器(CTS/ECT):将发动机温度信号输送给ECU,ECU将电压信号转换成温度读值。其范围一般为-40—199℃、一40~248法或O一5.IV。进气压力传感器,其显示数据的单位可能是KPa,也可能是mmHg,还可能是mbar,要搞清楚这些单位之间的换算关系,即一个标准大气压约等于101KPa,约等于76mmHg,1mbar等于100Pa;再如节气门位置传感器,其显示数据的单位可能是角度,也可能是信号电压值,还可能是百分比,要搞清楚正常情况下这些数据的正常值才行。以下结合我在实际维修工作中的维修实例,谈一谈运用“数据流”进行电控系统故障诊断的体会。 一 利用“静态数据流”分析故障静态数据流是指接通点火开关,不起动发动机时,利用故障诊断仪读取的发动机电控系统的数据。例如进气压力传感器的静态数据应接近标准大气压力(100KPa—102KPa);冷却液温度传感器的静态数据凉车时应接近环境温度等。下面是利用“静态数据流”进行诊断的一个实例: 故障现象 一辆捷达王轿车,在入冬后的一天早晨无法起动。 检查与判断 首先进行问诊,车主反映:前几天早晨起动很困难,有时经很长时间也能起动起来,起动后再起动就一切正常。 一开始在别的修理厂修理过,发动机的燃油压力和气缸压力、喷油嘴、配气相位、点火正时以及火花塞的跳火情况都做了检查,也没有解决问题。通过对以上项目重新进行仔细检查,同样没发现问题,发动机有油、有火,就是不能起动,到底是什么原因呢?后来发现,虽经多次起动,可火花塞却没有被“淹”的迹象,这说明故障原因是冷起动加浓不够。如果冷起动加浓不够,又是什么原因造成的呢?冷却液温度传感器是否正常呢?用故障诊断仪检测发动机ECU,无故障码输出。通过读取该车发动机静态数据流发现,发动机ECU输出的冷却液温度为105℃,而此时发动机的实际温度只有2—3℃,很明显,发动机ECU所收到的水温信号是错误的,说明冷却液温度传感器出现了问题。为进一步确认,用万用表测量冷却液温度传感器与电脑之间线束,既没有断路,也没有短路,电脑给冷却液温度传感器的5V参考电压也正常, 于是将冷却液温度传感器更换,再起动正常,故障排除。 这起故障案例实际并不复杂,对于有经验的维修人员,可能会直接从冷却液温度传感器着手,找到问题的症结。但它说明一个问题,那就是电控燃油喷射发动机系统的ECU对于某些故障是不进行记忆存储的,比如该车的冷却液温度传感器,既没有断路,也没有短路,只是信号失真,ECU的自诊断功能就不会认为是故障。再比如氧传感器反馈信号失真,空气流量计电压信号漂移造成空气流量计所检测到的进气量与实际进气量出现差异等,都不能被ECU认可为故障。在这种情况下,阅读控制单元数据成为解决问题的关键。二 利用“动态数据流”分析故障动态数据流是指接通点火开关,起动发动机时,利用诊断仪读取的发动机电控系统的数据。这些数据随发动机工况的变化而不断变化,如进气压力传感器的动态数据随节气门开度的变化而变化;氧传感器的信号应在0.1V—0.9V之间不断变化等。通过阅读控制单元动态数据,能够了解各传感器输送到ECU的信号值,通过与真实值的比较,能快速找出确切的故障部位。 1 有故障码时的方法可重点针对与故障码相关的传感器的数据进行,分析是什么导致数据的变化,以找出故障原因所在。故障现象 一辆桑塔纳1.6i轿车(出租车),百公里油耗增加1L检查与判断 车主反映:前几天换了火花塞,调整了点火正时,油耗还是高,通过与车主交流确认不是油品的问题。于是连接故障诊断仪,进入“发动机系统”,读取故障码为“氧传感器信号超差”,是氧传感器坏了吗?进入“读测数据块”,读取16通道“氧传感器”的数据,显示为0.01V不变。氧传感器长时间显示低于0.45V的数值,说明两点:一是说明混合气稀,二是说明氧传感器自身信号错误。是混合气稀吗?通过发动机的动力表现来看,不应是混合气稀,那就重点检查氧传感器,方法是人为给混合气加浓(连加几脚油),同时观察氧传感器的数据变化情况。通过观察,在连加几脚油的情况下,氧传感器的数据由“0.01V”微变为“0.03V”,也就是说几乎不变,进一步检查氧传感器的加热线电压正常,说明氧传感器损坏。更换氧传感器,再用诊断仪读其数据显示0.1V—0.9V变化正常,至此维修过程结束。第二天,车主反映油耗恢复正常,故障排除。这是一起典型的由氧传感器损坏引起的油耗高的故障。2 无故障码时的方法通过对基本传感器信号数据的关联分析和定量对应分析来确定故障部位故障现象 一汽佳宝微面,加速无力、加速回火,有时急加速熄火检查与判断 初步判定是混合气过稀,为了证明这一点,我用两个方法进行了验证。一个方法是拆下空气滤清器,向进气道喷射化油器清洗剂,与此同时进行加速试验,明显感到加速有力,也不回火,故障现象消失,这可以证明混合气过稀的判断;另一个方法是连接诊断仪,读取故障码,显示无故障码;读取数据流,观察氧传感器的数据,显示在0.3V—0.4V左右徘徊,加几脚油门,氧传感器数据立即越过0.45V上升到0.9V,然后其数据又回到0.3V—0.4V左右徘徊,这说明氧传感器是好的,因为它在人为对混合气加浓后,数据反应及时,变化正常,同时也证明混合气确实是过稀。是什么原因造成混合气过稀呢?通过分析,主要考虑进气压力传感器和燃油系统油压。首先判断进气压力传感器,进入“读测数据流”,读取进气压力传感器的数据,显示:静态数据1010mbar,为大气压力,正常;怠速时为380mbar,基本正常;急加速时数据可迅速升至950mbar以上,这些数据及其变化都表明,进气压力传感器基本正常。接下来开始检测油压,但由于油压表坏了,无法测量燃油系统油压,只好直接更换油泵。更换油泵后试车,故障现象消失,故障排除。最后的结果说明故障是因为油泵的供油能力不足导致混合气过稀而造成的。运用“数据流”进行故障分析,便于维修人员了解汽车的综合运行参数,可以定量分析电控发动机的故障,有目的地去检测更换有关元件,在实际维修工作中可以少走很多弯路,减少诊断时间,极大地提高工作效率。
2023-06-12
4条回答
问
谁有具体数据说说日系和欧美系安全性哪个高
6e3f98d5b56a
车辆的安全性不是绝对的,是相对的,比较而言,同级别的车欧美系安全性要好于日系,为什么呢?因为重心稳。为什么稳?因为车重,所以安全性能就高。也就是为什么油耗相对来说要比日系车高的一部分原因!另外,日系车在很多人眼中,还是安全性能比较低的。这种观点是错误的!首先,安全性能应该从两个因素来考虑,第一是看主动安全性能。比如说定速巡航。中央差速器等等。第二是被动安全性能。也就是以上我说所得底盘重。重心稳!日系车为了省油,在底盘的重量方面考虑的相当的精简,但是在主动安全性能上面考虑的也并非比欧美车系少!另外,从操控性来说,欧美车普遍要好些。但日系车显然相对于同等级的车来说,更注重车内的舒适性!
2023-06-04
1条回答
问
求,差动继电器的技术数据
f54994150144
作为保护装置,差动继电器由位于系统中两个不同位置的电流互感器提供反馈信息。差动继电器对电流进行比较,如果存在不同则表示受保护区域内有故障存在。这些装置常被用于保护发电机或变压器的线圈。技术数据 1.额定电流5A,额定频率50Hz。 2.无制动时继电器的起始动作安匝AWo=60±4。 3.当用于保护三绕组电力变压器时,其动作电流可在3A至12A的范围内进行整定(AWo=60),对于动作的最小整定值,其最大平衡系数接近于2。 当用于保护两绕组电力变压器时,其动作电流可以在1.55A至12A的范围内进行整定。 4.由动作电流与制动电流的比值所决定的制动系数Kz可以在广泛的范围内变化,图3的制动特性AWp=f(AWz)是其极限范围,它与工作电流和制动电流间的相位角有关,但无论在任何角下都不应越出曲线的范围。 5.可靠系数(当一次动作电流等于5IDZ,的继电器正弦动作电流与当一次动作电流等于IDZ的正弦动作电流的比值)不小于1.35。 6. 3倍动作电流时差动继电器的动作时间不大于0.035s。 7.继电器具有一个动合触点,在电感性负荷的直流电路中,(其时间常数不大于5×10-3s),且电压不大于220V,电流不大于2A时,触点的断开容量50W。 8. 在正常工作状态下当电流为5A且变流器的制动绕组平衡绕组在全部匝数投入的情况下继电器的单相功率消耗不大于8.5VA。 9. 变流器的工作、平衡和制动绕组可长期通过电流10A。 10. 介质强度:继电器的电路对外露非带电金属部分之间应能耐受2kV,50Hz的交流电压历时1min而无击穿或闪络现象。参考 http://www.315mro.com
2023-03-30
2条回答
问
中央数据表的概念及其作用
e136c5391ee1
中央银行制度的定义,建立中央银行制度的必要性,中央银行产生的历史过程,中央银行的职责、业务活动的特征,中央银行的主要业务,中央银行资产负债表的主要内容,中央银行独立性的起源及其发展,中央银行体制下的支付清算系统,我国支付清算体系的架构。 货币政策目标与货币政策工具搭配使用的效果、我国中央银行在宏观经济调控中的作用。
2023-02-02
1条回答
上一页
34/39
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
下一页
求购
首页
找产品
找企业
论坛
我的