不平衡数据学习中学习目标与评价准则的研究

批准号:
61573348
项目类别:
面上项目
资助金额:
65.0 万元
负责人:
胡包钢
依托单位:
学科分类:
F0305.生物、医学信息系统与技术
结题年份:
2019
批准年份:
2015
项目状态:
已结题
项目参与者:
李纯果、范兴容、张勇、曹林林、樊艳波、盛柯恺
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
不平衡数据学习是大数据中的挑战之一。本课题旨在针对不平衡数据学习中首要问题“学习目标选择”进行系统性研究。在理论层面,探讨不平衡数据学习对“语义”与“计算”表达层面的特定学习目标;分析各种学习目标或评价准则的本质属性,解释为什么有些学习目标或准则能够完成不平衡数据学习任务,有些则无法胜任;推导各种常规性能类和信息类学习目标或评价准则与不平衡数据比的定量或定性关系。理论研究将为应用中选择学习目标或评价准则提供理论依据。在方法层面,扩展现有分类器包括拒识功能的应用,研究优化拒识学习目标及其拒识中优化门槛值性质;开展面向大规模数据的Boosting分类器研究,使其能够实现带拒识功能的学习,自适应于不平衡比的优化门槛值调节,并尽量兼容“凸优化”的学习目标。本课题的最终目标是推动以“学习目标选择”为主题的新视角研究方向,并为不平衡数据学习中包容拒识功能的分类器设计提供具体研究实例。
英文摘要
Imbalanced data learning is one of the challenges in big data processing. This program aims at a systematic study on the primary problem, namely “What to learn?”, in the imbalanced data learning. In a theoretical level, we will explore what the specific learning targets will be required by the imbalanced data learning in both “linguistic” and “computational” levels, respectively. A study will be made on the intrinsic properties of the learning targets and evaluation criteria, so that we can reach a theoretical understanding why some measures are proper in dealing with imbalanced data learning, some are not. We will further explore the information-based learning targets and criteria in comparison with the non-information ones, and will derive the their relations with respect to the imbalance ratio. The goal of the analytical study is to provide the guidelines in the selections of learning targets and evaluation criteria. In the approach level, we will advance the current classifiers with the abstaining functions for wider applications. We will study on the optimization of reject threshold and its associated properties. We will further explore the information-based learning targets and criteria in comparison with the non-information ones. Their connections are investigated. A novel boosting classifier will be developed by setting the multiple learning targets for a classifier-example study towards a large-scale data process. These targets will include the adaptation of imbalance ratio in the data, abstaining and non-abstaining classification, and convexity optimization. The final goal of this program is to put forward on the new study theme of “learning target selection” in machine learning and to provide a study example in the abstaining classifier design in imbalanced data learning.
不平衡数据学习是大数据中的挑战之一。本课题针对不平衡数据学习中首要问题“学习目标选择”进行了系统性研究。在理论层面,探讨了不平衡数据学习对“语义”与“计算”表达层面的特定学习目标;分析了各种学习目标或评价准则的本质属性,对于学习目标或评价准则是否能胜任不平衡数据中的学习任务,以人脸图像为例进行了解释;推导了两种常规性能类和信息类学习目标或评价准则与不平衡数据比的定量或定性关系。理论研究为应用中选择学习目标或评价准则提供了理论依据。在方法层面,我们扩展了现有分类器包括拒识功能的应用,研究优化了拒识学习目标及其拒识中优化门槛值性质。本课题的研究成果推动了以“学习目标选择”为主题的新视角研究方向,并为不平衡数据学习中包容拒识功能的分类器设计提供了具体研究实例。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
DOI:10.16383/j.aas.2017.c160720
发表时间:2017
期刊:自动化学报
影响因子:--
作者:冉智勇;胡包钢
通讯作者:胡包钢
A Coupled Hidden Markov Random Field model for simultaneous face clustering and tracking in videos
用于视频中同时人脸聚类和跟踪的耦合隐马尔可夫随机场模型
DOI:10.1016/j.patcog.2016.10.022
发表时间:2017-04
期刊:Pattern Recognition
影响因子:8
作者:Wu Baoyuan;Hu Bao-Gang;Ji Qiang
通讯作者:Ji Qiang
Centroid-aware local discriminative metric learning in speaker verification
说话人验证中的质心感知局部判别度量学习
DOI:10.1016/j.patcog.2017.07.007
发表时间:2017-12
期刊:Pattern Recognition
影响因子:8
作者:Sheng Kekai;Dong Weiming;Li Wei;Razik Joseph;Huang Feiyue;Hu Baogang
通讯作者:Hu Baogang
A knowledge-and-data-driven modeling approach for simulating plant growth and the dynamics of CO2/O2 concentrations in a closed system of plants and humans by integrating mechanistic and empirical models
一种知识和数据驱动的建模方法,通过整合机械模型和经验模型来模拟植物和人类封闭系统中的植物生长和 CO2/O-2 浓度动态
DOI:10.1016/j.compag.2018.03.006
发表时间:2018-05-01
期刊:COMPUTERS AND ELECTRONICS IN AGRICULTURE
影响因子:8.3
作者:Fan,Xing-Rong;Wang,Xiujuan;Hu,Bao-Gang
通讯作者:Hu,Bao-Gang
Data-Driven Synthesis of Cartoon Faces Using Different Styles
使用不同风格的卡通面孔的数据驱动合成
DOI:10.1109/tip.2016.2628581
发表时间:2017
期刊:IEEE Transactions on Image Processing
影响因子:10.6
作者:Zhang Yong;Dong Weiming;Ma Chongyang;Mei Xing;Li Ke;Huang Feiyue;Hu Bao-Gang;Deussen Oliver
通讯作者:Deussen Oliver
面向"知识"与"数据"共同驱动的机器学习模型参数可辨识性研究
- 批准号:61273196
- 项目类别:面上项目
- 资助金额:82.0万元
- 批准年份:2012
- 负责人:胡包钢
- 依托单位:
基于信息理论的机器学习目标与评价度量的研究
- 批准号:61075051
- 项目类别:面上项目
- 资助金额:35.0万元
- 批准年份:2010
- 负责人:胡包钢
- 依托单位:
智能系统中基于非线性变化能力的研究
- 批准号:60275025
- 项目类别:面上项目
- 资助金额:24.0万元
- 批准年份:2002
- 负责人:胡包钢
- 依托单位:
单株植物生长的计算机建模与三维可视化仿真
- 批准号:60073007
- 项目类别:面上项目
- 资助金额:17.0万元
- 批准年份:2000
- 负责人:胡包钢
- 依托单位:
模糊PID控制器的系统化研究
- 批准号:69874041
- 项目类别:面上项目
- 资助金额:12.0万元
- 批准年份:1998
- 负责人:胡包钢
- 依托单位:
国内基金
海外基金
