面向正样本和未标记样本学习的算法研究及其应用

批准号:
61876044
项目类别:
面上项目
资助金额:
64.0 万元
负责人:
刘波
依托单位:
学科分类:
F0605.模式识别与数据挖掘
结题年份:
2022
批准年份:
2018
项目状态:
已结题
项目参与者:
廉迎战、杨易扬、朱鉴、谢锐、蔡昊、阮奕邦、林露樾、车志勇、谢奕红
关键词:
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
微信扫码咨询
中文摘要
正样本和未标记样本学习是机器学习和数据挖掘中的重要研究领域,与传统有监督和半监督学习不同,该学习的训练集包含少量标记的正类样本和大量未标记的样本,其中可能包含未标记的正类样本和负类样本,并构造分类器预测未知样本是否属于正类。本项目拟基于支持向量机方法对正样本和未标记样本学习的问题进行研究。首先,针对面向多任务的正样本和未标记样本学习问题,本项目构建基于相似度度量的多任务模型,实现相关源任务之间的互助学习。其次,针对面向多视角的正样本和未标记样本学习问题,本项目通过构建多视角空间约束不等式,约束不同视角空间的分类平面,并建立目标方程获得分类器。最后,针对面向正样本和未标记样本数据流的个人兴趣总结问题,本项目构建支持向量描述机获得描述时间窗数据的支持向量样本,并提出基于时间窗的类聚类算法对用户个人兴趣进行总结。本项目旨在通过以上问题的解决为正样本和未标记样本学习的研究提供思路。
英文摘要
Positive and unlabeled Learning(PU learning) is an important area in the machine learning and data mining communities. Different from the traditional supervised learning and semi-supervised learning, the training set of PU learning consists of a small set of labeled positive examples and a large number of unlabeled examples, and there may exist positive examples and negative examples in the unlabeled data. PU learning aims at constructing a classifier based on the labeled positive examples and the unlabeled examples to justify whether a test data belongs to positive class or not. This project aims at designing support vector machine-based methods to resolve the research problems in the PU learning. First, to resolve the problem of multi-task-based positive and unlabeled learning, this project proposes similarity metric-based multi-task model to help the reciprocal learning in the multi-task problem so that we can improve the learning ability of the PU learning classifier. Second, to resolve the problem of multi-view-based positive and unlabeled learning, this project puts forward the constrains inequality to restrict the hyper-planes in each view space, and then builds the objective model to obtain the PU learning classifier. Finally, to resolve the problem of user’s concept summarization learning in the positive and unlabeled data stream, this project first constructs support vector data description machine to obtain the support vectors which can describe the data distribution of the data in each time window, and then proposes class-based clustering method to summarize user’s concepts in the data stream. This project aims at delivering research ideas to the area of positive and unlabeled learning.
正样本和未标记样本学习是机器学习和数据挖掘中的重要研究领域,与传统有监督和半监督学习不同,该学习的训练集包含少量标记的正类样本和大量未标记的样本,其中可能包含未标记的正类样本和负类样本,并构造分类器预测未知样本是否属于正类。本项目拟基于支持向量机方法对正样本和未标记样本学习的问题进行研究。首先,针对面向多任务的正样本和未标记样本学习问题,本项目构建基于相似度度量的多任务模型,实现相关源任务之间的互助学习。其次,针对面向多视角的正样本和未标记样本学习问题,本项目通过构建多视角空间约束不等式,约束不同视角空间的分类平面,并建立目标方程获得分类器。最后,针对面向正样本和未标记样本数据流的个人兴趣总结问题,本项目构建支持向量描述机获得描述时间窗数据的支持向量样本,并提出基于时间窗的类聚类算法对用户个人兴趣进行总结。本项目旨在通过以上问题的解决为正样本和未标记样本学习的研究提供思路。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
A Latent Variable Augmentation Method for Image Categorization with Insufficient Training Samples
一种用于训练样本不足的图像分类的潜变量增强方法
DOI:10.1145/3451165
发表时间:2021-07
期刊:ACM Transactions on Knowledge Discovery from Data
影响因子:3.6
作者:Luyue Lin;Xin Zheng;Bo Liu;Wei Chen;Yanshan Xiao
通讯作者:Yanshan Xiao
New Multi-View Classification Method with Uncertain Data
不确定数据的多视图分类新方法
DOI:10.1145/3458282
发表时间:2021-07
期刊:ACM Transactions on Knowledge Discovery from Data
影响因子:3.6
作者:Bo Liu;Haowen Zhong;Yanshan Xiao
通讯作者:Yanshan Xiao
A new self-paced learning method for privilege-based positive and unlabeled learning
一种新的自定进度学习方法,用于基于特权的积极无标签学习
DOI:10.1016/j.ins.2022.07.143
发表时间:2022-07
期刊:Information Sciences
影响因子:8.1
作者:Bo Liu;Junrui Liu;Yanshan Xiao;Qihang Chen;Kai Wang;Ruiguang Huang;Liangjiao Li
通讯作者:Liangjiao Li
A new dictionary-based positive and unlabeled learning method
一种新的基于字典的正向无标签学习方法
DOI:10.1007/s10489-021-02344-z
发表时间:2021-04
期刊:Applied Intelligence
影响因子:5.3
作者:Bo Liu;Zhijing Liu;Yanshan Xiao
通讯作者:Yanshan Xiao
An efficient dictionary-based multi-view learning method
一种高效的基于字典的多视图学习方法
DOI:10.1016/j.ins.2021.06.069
发表时间:2021-10
期刊:Information Sciences
影响因子:8.1
作者:Bo Liu;Xiaodong Chen;Yanshan Xiao;Weibin Li;Laiwang Liu;Changdong Liu
通讯作者:Changdong Liu
面向不确定信息和图分类的多视角学习
算法研究
- 批准号:--
- 项目类别:省市级项目
- 资助金额:10.0万元
- 批准年份:2025
- 负责人:刘波
- 依托单位:
基于支持向量机的正样本和未标记样本学习研究
- 批准号:2020A151501670
- 项目类别:省市级项目
- 资助金额:10.0万元
- 批准年份:2020
- 负责人:刘波
- 依托单位:
基于参数的迁移学习分析、建模与应用
- 批准号:61472090
- 项目类别:面上项目
- 资助金额:82.0万元
- 批准年份:2014
- 负责人:刘波
- 依托单位:
具有不确定性信息的一分类和多分类算法的研究
- 批准号:61203280
- 项目类别:青年科学基金项目
- 资助金额:24.0万元
- 批准年份:2012
- 负责人:刘波
- 依托单位:
国内基金
海外基金
