Collaborative Research: Non-negative Matrix Factorizations for Data Mining: Foundations, Capabilities, and Applications

协作研究:数据挖掘的非负矩阵分解:基础、功能和应用

基本信息

  • 批准号:
    0915228
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-09-01 至 2014-08-31
  • 项目状态:
    已结题

项目摘要

Nonnegative matrix factorization (NMF) factorizes an input nonnegative matrix into two nonnegative matrices of lower rank. It was recently discovered that NMF has unique ability to solve challenging data mining and machine learning problems. The advantage of NMF over existing unsupervised learning methods are (1) NMF can model widely varying data distributions, (2) NMF performs both hard and soft clustering simultaneously. (3) Many other data mining problems such as semi-supervised clustering problems can be reformulated as NMF problem. Building upon these foundations, the investigators propose to establish a NMF-based comprehensive framework for data mining: (a) Provide deeper understanding of NMF's clustering capability;(b) Extend data mining capability of NMF for solving various data mining and machine learning problems; (c) Develop fast numerical algorithms which incorporate the state-of-the-art developments from numerical optimization for various matrix factorization models; (d) Develop novel and rigorous proof strategies to prove the correctness and convergence properties of the numerical algorithms; (e) Apply and evaluate these new algorithms in real-world applications.The proposed work creates a new paradigm of analyzing vast amount of data and discovering new knowledge from the data by transforming established matrix computational methodologies. This new technology can automatically group news articles into meaningful categories, discover protein modules in protein networks, extract weather patterns in climate data, segment pictures into distinct objects, detect communities on the Web, and enable many other scientific discoveries and new technologies creation. On a fundamental level, the proposed work establishes that a simple matrix factorization in fact solves challenging data mining problems. This research reinforces the importance of mathematics in today's data centric world and encourages students to learn mathematics.
非负矩阵分解(NMF)将输入的非负矩阵分解为两个秩较低的非负矩阵。最近发现NMF具有解决具有挑战性的数据挖掘和机器学习问题的独特能力。 与现有的无监督学习方法相比,NMF的优点是(1)NMF可以对广泛变化的数据分布建模,(2)NMF同时执行硬聚类和软聚类。(3)许多其他数据挖掘问题,如半监督聚类问题,可以转化为NMF问题。在此基础上,研究者提出建立一个基于NMF的数据挖掘综合框架:(a)提供对NMF聚类能力的更深入理解;(B)扩展NMF的数据挖掘能力,以解决各种数据挖掘和机器学习问题;(c)开发快速数值算法,该算法结合了各种矩阵分解模型的数值优化的最新发展;(d)开发新的和严格的证明策略,以证明数值算法的正确性和收敛性;(e)在实际应用中应用和评估这些新算法。拟议的工作创造了一个新的范式,通过转换现有的矩阵计算方法来分析大量数据并从数据中发现新的知识。这项新技术可以自动将新闻文章分组为有意义的类别,发现蛋白质网络中的蛋白质模块,提取气候数据中的天气模式,将图片分割为不同的对象,检测网络上的社区,并实现许多其他科学发现和新技术的创造。在一个基本的水平上,所提出的工作建立了一个简单的矩阵分解,实际上解决了具有挑战性的数据挖掘问题。这项研究强调了数学在当今以数据为中心的世界中的重要性,并鼓励学生学习数学。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Chris Ding其他文献

An NMF-framework for Unifying Posterior Probabilistic Clustering and Probabilistic Latent Semantic Indexing
用于统一后验概率聚类和概率潜在语义索引的 NMF 框架
Labeled-Robust Regression: Simultaneous Data Recovery and Classification
标记稳健回归:同步数据恢复和分类
  • DOI:
    10.1109/tcyb.2020.3026101
  • 发表时间:
    2020-11
  • 期刊:
  • 影响因子:
    11.8
  • 作者:
    Deyu Zeng;Zongze Wu;Chris Ding;Zhigang Ren;Qingyu Yang;Shengli Xie
  • 通讯作者:
    Shengli Xie
Feature selection: We've barely scratched the surface
功能选择:我们仅仅触及了表面
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    6.4
  • 作者:
    George Forman;Huan Liu;Edward R. Dougherty;Jennifer G. Dy;Kari Torkkola;E. Tuv;Hanchuan Peng;Chris Ding;Fuhui Long;Michael E. Berens;Lance Parsons;Lei Yu;Zheng Zhao
  • 通讯作者:
    Zheng Zhao
Towards a bridge between cost and wealth in risk-aware planning
  • DOI:
    10.1007/s10489-011-0279-y
  • 发表时间:
    2011-02-19
  • 期刊:
  • 影响因子:
    3.500
  • 作者:
    Yong Lin;Fillia Makedon;Chris Ding
  • 通讯作者:
    Chris Ding
Double Robust Principal Component Analysis
双稳健主成分分析
  • DOI:
    10.1016/j.neucom.2020.01.097
  • 发表时间:
    2020-05
  • 期刊:
  • 影响因子:
    6
  • 作者:
    Qianqian Wang;QuanXue Gao;Gan Sun;Chris Ding
  • 通讯作者:
    Chris Ding

Chris Ding的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Chris Ding', 18)}}的其他基金

EAGER: Collaborative Research: Cross-Domain Knowledge Transformation via Matrix Decompositions
EAGER:协作研究:通过矩阵分解进行跨领域知识转换
  • 批准号:
    0939187
  • 财政年份:
    2009
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
New Theoretical Foundations of Tensor Applications: Clustering, Error Analysis, Global Convergence, and Robust Formulations
张量应用的新理论基础:聚类、误差分析、全局收敛和鲁棒公式
  • 批准号:
    0917274
  • 财政年份:
    2009
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Matrix-Model Machine Learning: Unifying Machine Learning and Scientific Computing
协作研究:矩阵模型机器学习:统一机器学习和科学计算
  • 批准号:
    0830780
  • 财政年份:
    2008
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
SGER: Collaborative Research: Non-negative Matrix Factorizations for Data Mining: Algorithms and Applications
SGER:协作研究:数据挖掘的非负矩阵分解:算法和应用
  • 批准号:
    0844497
  • 财政年份:
    2008
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant

相似国自然基金

Research on Quantum Field Theory without a Lagrangian Description
  • 批准号:
    24ZR1403900
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
Cell Research
  • 批准号:
    31224802
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research
  • 批准号:
    31024804
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Cell Research (细胞研究)
  • 批准号:
    30824808
  • 批准年份:
    2008
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
Research on the Rapid Growth Mechanism of KDP Crystal
  • 批准号:
    10774081
  • 批准年份:
    2007
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: Non-Linearity and Feedbacks in the Atmospheric Circulation Response to Increased Carbon Dioxide (CO2)
合作研究:大气环流对二氧化碳 (CO2) 增加的响应的非线性和反馈
  • 批准号:
    2335762
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Non-Linearity and Feedbacks in the Atmospheric Circulation Response to Increased Carbon Dioxide (CO2)
合作研究:大气环流对二氧化碳 (CO2) 增加的响应的非线性和反馈
  • 批准号:
    2335761
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Catholyte Molecular Design For Non-aqueous Mg-organic Hybrid Redox Flow Batteries
合作研究:非水镁有机混合氧化还原液流电池的阴极电解液分子设计
  • 批准号:
    2419938
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: CCF Core: Small: User-transparent Data Management for Persistence and Crash-consistency in Non-volatile Memories
协作研究:CCF 核心:小型:用户透明的数据管理,以实现非易失性存储器中的持久性和崩溃一致性
  • 批准号:
    2313146
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Advances in the Theory and Practice of Non-Euclidean Statistics
合作研究:非欧几里得统计理论与实践的进展
  • 批准号:
    2311058
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: Non-Parametric Inference of Temporal Data
合作研究:时态数据的非参数推理
  • 批准号:
    2311249
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: Hidden Dimensions of Diversity in Woodland Salamanders: Investigating Ecophysiological Evolution in a Classic Non-Adaptive Radiation
合作研究:林地蝾螈多样性的隐藏维度:研究经典非适应性辐射中的生态生理进化
  • 批准号:
    2403865
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: New Phase Diagrams for Predictive Solvothermal Synthesis in Non-Aqueous Solvents
合作研究:非水溶剂中预测溶剂热合成的新相图
  • 批准号:
    2240281
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: New Phase Diagrams for Predictive Solvothermal Synthesis in Non-Aqueous Solvents
合作研究:非水溶剂中预测溶剂热合成的新相图
  • 批准号:
    2240282
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: RUI: Elucidating Design Rules for non-NRPS Incorporation of Amino Acids on Polyketide Scaffolds
合作研究:RUI:阐明聚酮化合物支架上非 NRPS 氨基酸掺入的设计规则
  • 批准号:
    2300890
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了