数据挖掘中组合技术里的投票机制是怎么回事?怎么理解呢

全部回答1
默认 最新
  • 投票和现实中的投票本质是一样的,现实中投票是为了取得一种权衡,Boosting中也是一样。一般而言,弱分类器(或者弱排序器等等)由于假设原因,或多或少会存在过拟合等现象,即部分属性能够很好区分,部分属性则被忽略,导致这些弱分类器往往只能正确处理一部分样本,而解决不了另一部分样本。那么,解决的办法,就是把这些弱分类器通过某种机制组合起来,比如投票。通过投票,单一弱分类器由于过拟合等原因无法处理特定属性的缺陷就在一定程度上被弥补了。投票的机制也有很多,最简单的就是把大家的结果放在一起做个平均。相应的,也有很多更复杂的机制,比如经典的AdaBoost,有一个反馈调节的机制,每一轮学习之后,专门把那些没有正确处理的样本挑出来,针对其需求设计专门的弱分类器,或者给相应的弱分类器加以更强的权重(等于投票的分量更大)。这样不断迭代,最后就能够利用一组弱分类器的加权投票来获得总体效果较强的一个组合分类器。
    0 点赞

没有更多内容了

返回顶部
产品求购 求购