当前位置: 首页 > news >正文

郑州网站建设推广渠道广东做seo的公司

郑州网站建设推广渠道,广东做seo的公司,如何自己做游戏软件,中国最牛的央企排名0 摘要 论文:A Systematic Study of Online Class Imbalance Learning With Concept Drift 发表:2018年发表在TNNLS上 源代码:? 作为一个新兴的研究课题,在线类非平衡学习往往结合了类非平衡和概念漂移的挑战。它处理…

0 摘要

论文:A Systematic Study of Online Class Imbalance Learning With Concept Drift
发表:2018年发表在TNNLS上
源代码:?

作为一个新兴的研究课题,在线类非平衡学习往往结合了类非平衡和概念漂移的挑战。它处理具有非常倾斜的类分布的数据流,其中可能发生概念漂移。它最近受到越来越多的研究关注;然而,很少有研究解决类失衡和观念漂移并存的综合问题。作为第一个系统研究类不平衡数据流中处理概念漂移的研究,本文首先对该领域的研究进展进行了全面回顾,包括当前的研究重点和开放的挑战。然后,进行了深入的实验研究,目的是了解如何最好地克服类不平衡的在线学习中的概念漂移。

1 引言

随着机器学习算法在现实世界中的广泛应用,类失衡和概念漂移已经成为重要的学习问题。风险管理[1]、异常检测[2]、软件工程[3]和社交媒体挖掘[4]等各个领域的应用都受到类不平衡和概念漂移的影响。当数据类别的代表性不均匀时,即至少有一个类别与其他类别相比是少数类别[5]。它会导致对多数类的学习偏差和泛化不良。概念漂移是问题底层分布的变化,特别是在从数据流中学习时[6],这是一个重要的问题。它要求学习者能够适应动态变化。

类不平衡和概念漂移会严重阻碍预测性能,当它们同时发生时问题变得尤为具有挑战性。这一挑战源于这样一个事实,即一个问题可能影响对另一个问题的治疗。例如,传统的基于分类误差的漂移检测算法可能对不平衡程度敏感而变得不那么有效,而类不平衡技术需要适应不平衡率的变化;否则,目前受到优待的类可能不是正确的少数类。
虽然已有论文分别对分布不平衡的数据流和概念漂移的数据流进行了研究,但对类不平衡和概念漂移同时存在的情况的研究却很少。Hoens等人[7]首次概述了组合问题,但只介绍了一些基于块的学习技术。本文旨在通过实验研究对类不平衡数据流中概念漂移的处理进行更系统的研究。我们专注于在线(即一对一)学习,因为它比基于块的学习更困难,考虑到一次只有一个实例可用。此外,在线学习方法可以应用于数据以块形式到达的问题,但是基于块的学习方法不能应用于存在高速和内存限制的在线问题。在线学习方法对于产生高速数据流的应用特别有用,例如机器人系统和传感器网络[3]。

本文首先对该领域的研究进展进行了综述,包括问题定义、问题和方法分类、性能评估以及最新的方法。它揭示了新的挑战和研究差距。大多数现有的工作集中在后验概率中的概念漂移[即真实概念漂移[8]和 P ( y ∣ x ) P(y|x) P(yx)的变化]。其他类型的概念漂移所面临的挑战尚未得到充分讨论和处理。特别是,先验概率 P ( y ) P(y) P(y)的变化与类不平衡密切相关,但大多数现有工作都忽略了这一点。大多数提出的概念漂移检测方法都是针对平衡数据流设计和测试的。很少有方法旨在同时解决类不平衡和概念漂移。在有限的解决方案中,仍不清楚哪种方法更好,何时更好。应用类不平衡技术(例如,重采样方法)是否以及如何影响概念漂移检测和在线预测也是未知的。

为了填补研究空白,我们通过关注三个研究问题,提供了一个关于如何最好地克服类不平衡在线学习中的概念漂移的实验见解。

    1. 当数据流不平衡时,检测每种类型的概念漂移的挑战是什么?
    1. 在针对在线类不平衡学习的概念漂移方法中,哪一种方法对哪种类型的概念漂移效果更好?
    1. 应用类不平衡技术(例如,重采样方法)是否有助于概念漂移检测和在线预测?

在人工数据流以及真实数据集中三种基本的概念漂移类型(即先验概率 P ( y ) P(y) P(y)、类条件概率密度函数(pdf) P ( x ∣ y ) P(x|y) P(xy)和后验概率 P ( y ∣ x ) P(y|x) P(yx)的变化)下,对在线类失衡漂移检测方法(DDM-OCI)[9]、线性四率(LFR)[10]、ROC曲线下的先验面积Page-Hinkley (PAUC-PH)[11]、[12]、OOB[13]、RLSACP[14]和ESOSELM[15]等六种最新方法进行了比较和深入分析。据我们所知,它们是迄今为止为数不多的明确设计用于解决类不平衡和概念漂移的在线学习问题的方法。

最后,在综述和实验结果的基础上,我们提出了开发一种有效的从概念漂移的不平衡数据流中学习的算法需要考虑的几个重要问题。我们强调研究类失衡和观念漂移的相互影响的重要性。

本文的主要贡献包括:

    1. 首次全面研究了类不平衡数据流中的概念漂移检测;
    1. 将数据问题分为不同类型的概念漂移和类失衡,并进行了说明应用;
    1. 对各类现有方法进行系统比较分析;
    1. 研究了每种方法的优缺点;
    1. 研究结果为未来学习任务选择合适的技术和开发更好的算法提供指导;
    1. 这也是首次探讨类不平衡技术在概念漂移检测中的作用,揭示了是否以及如何同时解决类不平衡和概念漂移。

本文的其余部分组织如下。第二部分阐述了学习问题,包括一个学习框架和详细的问题描述,以及对类失衡和概念漂移的单独介绍。第三节回顾了类失衡和概念漂移的综合问题,包括示例应用和现有解决方案。第四部分进行了实验研究,旨在找到三个研究问题的答案。第五节得出结论并指出未来可能的方向。

http://www.tj-hxxt.cn/news/124154.html

相关文章:

  • 运输网站建设百度seo推广方案
  • 邯郸事件最新消息新闻淘宝优化关键词的步骤
  • 织梦移动端网站怎么做廊坊百度快照优化哪家服务好
  • ip做网站地址灰色行业推广平台网站
  • 清丰网站建设价格seo技术培训宁波
  • 视频网站seo怎么做站长统计幸福宝
  • 公司管理培训课程南宁百度推广seo
  • 专业建站网网站运营推广广告服务平台
  • 北京网站建设第一灰色词排名接单
  • 网站页面统计代码广州seo运营
  • 泉州专门做网站aso如何优化
  • 如何用织梦搭建网站百度推广客户端app
  • wordpress的主题修改海口网站关键词优化
  • 云主机建设网站指数函数求导
  • 做视频网站 服务器配置厦门零基础学seo
  • 做任务赚钱的网站起什么名字好论文收录网站有哪些
  • 网站建设对图片有哪些要求新闻头条最新消息
  • 四川佳和建设工程网站公众号代运营
  • 云南旅游网站建设seo优化排名价格
  • 建设银行杭州纪念币预约网站谷歌浏览器安卓版
  • 深圳建设网官方网站seo实战培训费用
  • 网站资料素材怎么做搜索关键词
  • 网站备案单位查询加拿大搜索引擎
  • 广州网站建设q.479185700棒太原网站建设方案咨询
  • 手机打开网站自动跳转网站优化seo是什么
  • 淮安高端网站制作青岛百度推广优化怎么做的
  • 用dw做网站首页国外十大免费服务器和域名
  • 做类似淘宝的网站需多少资金微信朋友圈营销文案
  • 海口手机建站模板做百度推广需要什么条件
  • 常用网站缩略图自定义百度拍照搜索