类别不平衡学习:理论与算法
上QQ阅读APP看书,第一时间看更新

1.6 文献导读

对于初入此领域的读者,建议可先阅读类别不平衡学习方面的综述文章。He等人[10]于2009年发表于IEEE Transactions on Knowledge and Data Engineering上的Learning from Imbalanced Data一文较全面地评述与总结了类别不平衡学习的相关概念与算法,并对未来的发展方向进行了展望,该文目前在Google学术上已被引用超过1600次。文献[11]也是该领域一篇相对较为全面的综述文章,相比于文献[10],文献[11]更侧重对各类算法的总结与归纳,相对通俗易懂。而对于生物信息学领域的读者,则建议仔细阅读文献[12],该文献从生物信息学中各类应用与类别不平衡学习相融合的角度对前人文献进行了综述,并对融合中所产生的一些新问题进行了总结与展望。

有关类别不平衡学习的早期研究成果可参考文献[13-15]。实际上,很多经典的算法都是在早期研究中开发的,如随机采样算法[25]、SMOTE算法[26]、代价敏感决策树算法[35]以及代价敏感Boosting算法[41]等。此外,有关类别不平衡学习的基础理论也是在早期研究中所奠定的[22],[24]。建议读者应仔细阅读上述论文,从而为后续的学习与研究打下坚实的基础。

考虑到读者所关注的应用方向可能有所不同,故在本章中也列出了一些与类别不平衡学习相关的应用类文献,如网络入侵检测[62]、信用卡欺诈检测[63]、异常行为检测[64]、垃圾邮件过滤[65]、文本分类[66]、医学诊断[54]、生物信息学[67]、软件缺陷检测[68],[69]及遥感图像标注[70]等。当然,上述文献只包括了类别不平衡学习的部分应用领域,故也建议读者根据自身需要在文献库中查找所需文献。

有关类别不平衡学习理论与算法方面的论文通常发表于人工智能、机器学习与数据挖掘等领域的期刊及会议上,如IJCAI、AAAI、ICML、KDD、ICDM、SDM、PKDD、PAKDD、IJCNN、IEEE TSMC:Part B、IEEE TNNLS、IEEE TKDE、IEEE TPAMI、IEEE TFS、Pattern Recognition、Information Science、Knowledge-Based Systems、Neural Processing Letters、Neurocomputing等。而关于类别不平衡学习应用方面的文章,也可能发表在一些交叉领域的期刊上。读者可根据关键词查询技术来搜索并下载该领域最新的文献,跟踪其发展动态。