面向大数据机器学习的不确定性建模及应用研究
结题报告
批准号:
61732006
项目类别:
重点项目
资助金额:
260.0 万元
负责人:
陈松灿
依托单位:
学科分类:
F0605.模式识别与数据挖掘
结题年份:
2022
批准年份:
2017
项目状态:
已结题
项目参与者:
张道强、谭晓阳、周春来、黄圣君、戚荣丰、朱旗、赵素云、赵艳娥、蔡昕烨
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
大数据机器学习在数据原料、算法设计及优化求解等不同层次存在多种不确定性,给传统方法带来严重挑战。本课题利用机器学习、随机优化、分布式计算等方面的最新研究成果,着重开展“针对不可靠数据的学习原料提炼”、“面向动态多变环境的学习算法设计”、“针对大规模复杂问题的优化求解”和“面向脑疾病大数据的应用”等研究工作。特别是研究多源异构数据融合、主动标记查询、样本分布变化跟踪、语义迁移建模、标记变化检测、大规模非凸优化等新方法,在大数据机器学习不确定性建模的技术和方法上取得创新。并基于以上研究成果,对阿尔茨海默病、颅内动脉瘤等脑疾病医疗大数据任务进行典型应用。
英文摘要
In big data machine learning, there are various uncertainties in data source, algorithm design and optimization, which pose serious challenges for traditional methods. This project employs recent advances in machine learning, stochastic optimization and distributed computing to study the following research topics: "refinement of unreliable data", "learning algorithm designing for dynamic environment", "optimization for large scale problem with complex structures" and "application on brain disease analysis". More specifically, the project will focus on multi-sourced heterogeneous data fusion, active label querying, tracking of data distribution change, modeling on concept shift, detection of class label evolving and large scale optimization for non-convex problems, and try to make technique breakthroughs on modeling uncertainty for big data machine learning. Also, the research achievements will be applied to medical data analysis, especially for Alzheimer's disease and intracranial aneurysm.
数据规模的急剧膨胀同样也带来了诸多不定因素,其主要体现在数据质量的下降,应用环境的动态多变以及学习问题的更加复杂等,由此带来了一系列学习上的问题,我们将之归结为大数据机器学习在数据、环境和模型求解三个层面的不确定性。以往机器学习的不确定性研究更多关注的是数据不确定性,而相对较少关注环境和求解过程的不确定性。本项目系统性地研究不确定性在数据表征、环境变化和求解过程中对预测任务的影响,同时在数据层,算法层和优化层开展不确定性建模,并面向脑疾病大数据进行应用层研究。针对不可靠数据的学习原料提炼方面,通过研究复杂环境中数据不确定性统一表征模型和理论,提出了多种不可靠数据的学习原料提炼方法。在面向动态多变环境的学习算法设计方面,建立了动态环境下面向样本分布、语义概念、输出空间变化的鲁棒学习算法。针对大规模复杂问题的优化求解方面,提出了针对大规模复杂问题的鲁棒和快速优化求解方法。在面向脑疾病大数据的应用方面,将以上创新成果应用于脑疾病的诊断问题,有效提升了其诊断精度和效率。.通过项目的开展,发表论文130余篇。其中CCF A类文30余篇,CCF B类文30余篇。发表的论文他引2500余次,其中发表在TPAMI上的一文他引400余次。引文作者不乏多名IEEE Fellow和本领域的知名学者。在应用方面,脑疾病诊断方面的成果发表在Nature Communications上。陈松灿、张道强教授入选IAPR Fellow,陈松灿教授入选中国人工智能学会会士(CAAI Fellow)。张道强入选国家万人计划科技创新领军人才,黄圣君入选国家优青,黄飞虎入选国家高层次青年人才。陈松灿、张道强、谭晓阳均在项目期内连续入选Elsevier高被引学者。培养的学生获江苏省优秀博士学位论文2篇,江苏省优秀硕士学位论文4篇,江苏省计算机学会优秀博士学位论文1篇,江苏省计算机学会优秀硕士学位论文5篇,江苏省人工智能学会优秀博士学位论文2篇,中国图象图形学学会优秀博士学位论文提名1篇。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Distribution agnostic Bayesian matching pursuit based on the exponential embedded family
基于指数嵌入族的分布不可知贝叶斯匹配追踪
DOI:10.1016/j.neucom.2020.06.007
发表时间:2020-10
期刊:Neurocomputing
影响因子:6
作者:Di Ma;Songcan Chen
通讯作者:Songcan Chen
Cognitive Driven Multilayer Self-Paced Learning with Misclassified Samples
认知驱动的多层自定进度学习与错误分类的样本
DOI:10.1155/2019/8127869
发表时间:2019
期刊:Complexity
影响因子:2.3
作者:Qi Zhu;Ning Yuan;Donghai Guan
通讯作者:Donghai Guan
DOI:10.1109/tcds.2021.3098743
发表时间:2021
期刊:IEEE Transactions on Cognitive and Developmental Systems
影响因子:5
作者:Shuo Huang;Liang Sun;Muhammad Yousefnezhad;Meiling Wang;Daoqiang Zhang
通讯作者:Daoqiang Zhang
Heterogeneous multi-output classification by structured conditional risk minimization
通过结构化条件风险最小化的异构多输出分类
DOI:10.1016/j.patrec.2018.09.011
发表时间:2018
期刊:Pattern Recognition Letters
影响因子:5.1
作者:Ma Zhongchen;Chen Songcan;Ma Di
通讯作者:Ma Di
Learning Dynamic Conditional Gaussian Graphical Models
学习动态条件高斯图形模型
DOI:10.1109/tkde.2017.2777462
发表时间:2018
期刊:IEEE Transactions on Knowledge and Data Engineering
影响因子:8.9
作者:Huang Feihu;Chen Songcan
通讯作者:Chen Songcan
基于类不平衡本质的长尾识别方法研究及拓展
  • 批准号:
    62376126
  • 项目类别:
    面上项目
  • 资助金额:
    51万元
  • 批准年份:
    2023
  • 负责人:
    陈松灿
  • 依托单位:
自监督学习本质的有效性探究、论证及拓展增强
  • 批准号:
    --
  • 项目类别:
    面上项目
  • 资助金额:
    58万元
  • 批准年份:
    2020
  • 负责人:
    陈松灿
  • 依托单位:
多维输出分类学习的关键问题研究及其拓展
  • 批准号:
    61672281
  • 项目类别:
    面上项目
  • 资助金额:
    60.0万元
  • 批准年份:
    2016
  • 负责人:
    陈松灿
  • 依托单位:
基于人脸的性别分类和年龄估计统一学习框架及其拓展研究
  • 批准号:
    61472186
  • 项目类别:
    面上项目
  • 资助金额:
    81.0万元
  • 批准年份:
    2014
  • 负责人:
    陈松灿
  • 依托单位:
半监督半配对高维多表示数据的降维及拓展研究
  • 批准号:
    61170151
  • 项目类别:
    面上项目
  • 资助金额:
    57.0万元
  • 批准年份:
    2011
  • 负责人:
    陈松灿
  • 依托单位:
稀疏性保持的降维技术及其拓展研究
  • 批准号:
    60973097
  • 项目类别:
    面上项目
  • 资助金额:
    32.0万元
  • 批准年份:
    2009
  • 负责人:
    陈松灿
  • 依托单位:
分类器的局部性正则化设计技术研究
  • 批准号:
    60773061
  • 项目类别:
    面上项目
  • 资助金额:
    28.0万元
  • 批准年份:
    2007
  • 负责人:
    陈松灿
  • 依托单位:
增强型线性判别分析及其推广性研究
  • 批准号:
    60473035
  • 项目类别:
    面上项目
  • 资助金额:
    23.0万元
  • 批准年份:
    2004
  • 负责人:
    陈松灿
  • 依托单位:
核框架下的多对多联想记忆模型及其知识处理研究
  • 批准号:
    60271017
  • 项目类别:
    面上项目
  • 资助金额:
    18.0万元
  • 批准年份:
    2002
  • 负责人:
    陈松灿
  • 依托单位:
基于稀疏RAM的自适应模式识别系统及其推广性研究
  • 批准号:
    69973021
  • 项目类别:
    面上项目
  • 资助金额:
    13.0万元
  • 批准年份:
    1999
  • 负责人:
    陈松灿
  • 依托单位:
国内基金
海外基金