课题基金基金详情
大规模数据挖掘中嵌入式数据归约的稀疏模型与算法研究
结题报告
批准号:
61866010
项目类别:
地区科学基金项目
资助金额:
40.0 万元
负责人:
邵元海
依托单位:
学科分类:
F0603.机器学习
结题年份:
2022
批准年份:
2018
项目状态:
已结题
项目参与者:
卢媛、吴爽、张婷婷、黄凌伟、张军、陈文辉
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
如何有效进行数据归约是大规模数据挖掘的一个关键问题。嵌入式数据归约是指在学习数据挖掘任务的同时进行数据归约,是当前数据归约的研究热点。支持向量机是嵌入式数据归约的典型代表,然而传统的支持向量机只能进行样本归约,不能进行特征归约,并且对大规模数据的归约性能也亟待提高。本项目拟进一步改进支持向量机及有关嵌入式数据归约方法,施行大规模嵌入式数据归约。具体内容包括:研究对样本和特征具有更加稀疏性质的损失项和正则项,进而提出即可进行样本规约、又可进行特征归约的大规模支持向量机;对最小二乘支持向量机和判别分析,构造稀疏的特征选择和特征提取模型与算法;研究可以同时进行样本和特征归约的稀疏模型,重点关注其稀疏正则化和稀疏损失函数的可解释性和大规模问题的快速求解算法;最后,将以上研究应用于大规模图像信息检索问题。本项目的研究对大规模数据挖掘中嵌入式数据归约的理论和实践都具有创新意义。
英文摘要
How to effectively perform data reduction is a key issue for large-scale data mining. Embedded data reduction refers to data reduction while learning data mining tasks. It is a research hotspot for current data reduction. Support vector machine (SVM) is a typical representative of embedded data reduction. However, traditional support vector machines can only perform sample reduction, and cannot perform feature reduction. Furthermore, it is particularly important data to improve the performance of the data reduction for the large-scale. This project intends to further improve support vector machines and related embedded data reduction methods for large-scale embedded data reduction. The specific contents include: Study loss functions and regular terms with more sparse nature of both samples and features, and then propose the large-scale support vector machines that can perform sample reduction and feature reduction simultaneously; For least squares SVM and linear discriminant analysis, study the sparse models and algorithms for feature selection and feature extraction; study the sparse models that can simultaneously perform sample and feature reduction, focusing on the interpretability of sparse regularization and sparse loss functions, and fast algorithms of large-scale problems Finally, the above research is applied to the large-scale image information retrieval problem. The study of this project is of innovative significance to the theory and practice of embedded data reduction in large-scale data mining.
如何有效进行数据归约是大规模数据挖掘的一个关键问题。嵌入式数据归约是指在学习数据挖掘任务的同时进行数据归约,是当前数据归约的研究热点。本项目以支持向量机的同时样本归约和特征归约为研究切入点,研究对样本和特征具有更加稀疏性质的损失项和正则项,进而提出了即可进行样本规约、又可进行特征归约的大规模支持向量机;对最小二乘支持向量机和判别分析,构造稀疏的特征选择和特征提取模型与算法;研究了可以同时进行样本和特征归约的稀疏模型,特别是其稀疏正则化和稀疏损失函数的可解释性和大规模问题的快速求解算法;对设计的算法在实际问题进行了数值实验,选取优秀的算法并开发了性能优异的求解器。最后,将以上研究应用于大规模图像信息检索问题。.经过4年的研究,共发表了20篇与项目相关的研究论文,参加或参与组织国际国内学术会议10次,并做报告宣传项目研究成果。培养相关毕业研究生6名。其中,作为本项目的重要结果,给出了最小二乘支持向量机同时进行样本归约和特征归约的条件以及相应的模型与算法。给出了线性判别分析同时进行样本归约和特征归约的条件以及相应的模型与算法。建立了最具有稀疏性的L0/1损失支持向量机稀疏理论基础及大规模归约算法。这些稀疏算法与工作集算法和截断算法结合,从而使其适用于大规模数据挖掘中嵌入式数据归约。.总之,本项目的完成不仅为大规模数据挖掘中嵌入式数据归约提供新的稀疏模型和新算法,而且为学科交叉与融合提供了实践经验,对于人才培养以及嵌入式稀疏归约相关领域的深度合作与交流起到了积极推动作用。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Reverse nearest neighbors Bhattacharyya bound linear discriminant analysis for multimodal classification
用于多模态分类的反向最近邻 Bhattacharyya 边界线性判别分析
DOI:10.1016/j.engappai.2020.104033
发表时间:2021-01-01
期刊:ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE
影响因子:8
作者:Guo, Yan-Ru;Bai, Yan-Qin;Jiang, Cheng-zi
通讯作者:Jiang, Cheng-zi
DOI:10.1016/j.neunet.2021.04.030
发表时间:2021-05-10
期刊:NEURAL NETWORKS
影响因子:7.8
作者:Li, Chun-Na;Shao, Yuan-Hai;Deng, Nai-Yang
通讯作者:Deng, Nai-Yang
Generalized elastic net Lp-norm nonparallel support vector machine
广义弹性网Lp范数非并行支持向量机
DOI:10.1016/j.engappai.2019.103397
发表时间:2020-02
期刊:Engineering Applications of Artificial Intelligence
影响因子:8
作者:Chun-Na Li;Pei-Wei Ren;Yuan-Hai Shao;Ya-Fen Ye;Yan-Ru Guo
通讯作者:Yan-Ru Guo
Sparse L1-norm two dimensional linear discriminant analysis via the generalized elastic net regularization
基于广义弹性网正则化的稀疏 L1 范数二维线性判别分析
DOI:10.1016/j.neucom.2019.01.049
发表时间:2019-04-14
期刊:NEUROCOMPUTING
影响因子:6
作者:Li, Chun-Na;Shang, Meng-Qi;Wang, Zhen
通讯作者:Wang, Zhen
Robust and sparse linear discriminant analysis via alternating direction method of multipliers
通过乘子交替方向法进行稳健和稀疏线性判别分析
DOI:10.1109/tnnls.2019.2910991
发表时间:2020
期刊:IEEE Transactions on Neural Networks and Learning Systems
影响因子:10.4
作者:Li C N;Shao Y H;Yin W;Liu M Z
通讯作者:Liu M Z
完全统计学习的小数据支持向量机
  • 批准号:
    12271131
  • 项目类别:
    面上项目
  • 资助金额:
    46万元
  • 批准年份:
    2022
  • 负责人:
    邵元海
  • 依托单位:
SVM不定核学习的低秩优化算法
  • 批准号:
    11926349
  • 项目类别:
    数学天元基金项目
  • 资助金额:
    10.0万元
  • 批准年份:
    2019
  • 负责人:
    邵元海
  • 依托单位:
噪声数据的非凸损失函数支持向量机最优化模型与算法研究
  • 批准号:
    11871183
  • 项目类别:
    面上项目
  • 资助金额:
    52.0万元
  • 批准年份:
    2018
  • 负责人:
    邵元海
  • 依托单位:
国内基金
海外基金