CAREER: Learning Probabilistic Factor Models

职业:学习概率因子模型

基本信息

  • 批准号:
    1943902
  • 负责人:
  • 金额:
    $ 40万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-07-01 至 2025-06-30
  • 项目状态:
    未结题

项目摘要

A large amount of text and social network data is emerging in scientific research as well as everyday life. This project will develop statistical methods for analyzing data resulting in new scientific, sociological, and biomedical discoveries. The research has several fundamental challenges due to the features of the data: (1) large scale, which requires advanced strategies on storage, computation, and quality control; (2) a complicated structure, which makes careful statistical modeling a critical need; and (3) strong noise, which requires sophisticated de-noising techniques. To address these challenges, the PI proposes a universal probabilistic factor modeling approach. The research will provide an array of statistical tools for social network analysis, natural language processing, RNA-sequencing data analysis, and electronic health records analysis. This project will also help train graduate and undergraduate students on data collection, data cleaning, statistical methodology and theory. In addition, this project will release new software and data sets for network and text analysis providing useful resources for both education and research. Probabilistic factor models refer to factor models whose factors or factor loadings are connected to probability mass functions. Examples include the topic models in text mining and mixed membership models in social networks. Due to the nonnegative constraints and the dependent and heteroscedastic noise in these models, statistical estimation and inference are extremely challenging. This project will tackle these challenges and apply the proposed methods to different applications. The first thrust aims to develop a novel framework for exploring sparsity in topic models. It proposes a new notion of "sparsity" on the vocabulary, which is different from the conventional notion of sparsity in high-dimensional statistics. The framework will provide a theoretical foundation for dimension reduction in text mining, as well as new word screening methods and new spectral methods for topic weight estimation. The second thrust aims to study the fundamental statistical limits for network mixed membership estimation. It will lead to a new optimality theory of mixed membership estimation, especially for network models with a large degree of heterogeneity, and new random matrix theory for empirical eigenvectors. It will also produce data sets about the networks among academic researchers in statistics-related fields and generate discoveries about the trend and patterns in academic research. The third thrust aims to adapt the above technical tools to biomedical data, including bulk and single-cell RNA-sequencing data and electronic health care data. It will result in new mixture models and statistical inference tools for biomedical data.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
科学研究和日常生活中出现了大量文本和社交网络数据。该项目将开发用于分析数据的统计方法,从而产生新的科学,社会学和生物医学发现。由于数据的特点,该研究面临几个基本挑战:(1)大规模,需要先进的存储,计算和质量控制策略;(2)复杂的结构,这使得仔细的统计建模成为关键需求;(3)强噪声,需要复杂的去噪技术。为了应对这些挑战,PI提出了一种通用的概率因素建模方法。该研究将为社交网络分析、自然语言处理、RNA测序数据分析和电子健康记录分析提供一系列统计工具。 该项目还将帮助培训研究生和本科生数据收集,数据清理,统计方法和理论。此外,该项目还将发布用于网络和文本分析的新软件和数据集,为教育和研究提供有用的资源。 概率因子模型是指因子或因子载荷与概率质量函数相关联的因子模型。例子包括文本挖掘中的主题模型和社交网络中的混合成员模型。由于这些模型中的非负约束以及相关和异方差噪声,统计估计和推断极具挑战性。该项目将应对这些挑战,并将所提出的方法应用于不同的应用程序。第一个推力的目的是开发一个新的框架,探索稀疏的主题模型。在词汇表上提出了一个新的“稀疏性”概念,它不同于高维统计中的传统稀疏性概念。该框架将为文本挖掘中的降维提供理论基础,并为主题权重估计提供新词筛选方法和新的谱方法。第二个目标是研究网络混合隶属度估计的基本统计极限。它将导致一种新的混合隶属度估计的最优性理论,特别是对于具有很大程度异质性的网络模型,以及新的经验特征向量随机矩阵理论。它还将产生关于南极学相关领域学术研究人员网络的数据集,并发现学术研究的趋势和模式。第三个目标是使上述技术工具适用于生物医学数据,包括批量和单细胞RNA测序数据和电子医疗保健数据。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Improvements on SCORE, Especially for Weak Signals
SCORE 的改进,特别是对于弱信号
  • DOI:
    10.1007/s13171-020-00240-1
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jin, Jiashun;Ke, Zheng Tracy;Luo, Shengming
  • 通讯作者:
    Luo, Shengming
Phase transition for detecting a small community in a large network
用于检测大型网络中的小社区的相变
Optimal adaptivity of signed-polygon statistics for network testing
  • DOI:
    10.1214/21-aos2089
  • 发表时间:
    2019-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiashun Jin;Z. Ke;Shengming Luo
  • 通讯作者:
    Jiashun Jin;Z. Ke;Shengming Luo
A Comparison of Hamming Errors of Representative Variable Selection Methods
代表性变量选择方法的汉明误差比较
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ke, Zheng Tracy;Wang, Longlin
  • 通讯作者:
    Wang, Longlin
Allocation of COVID‐19 testing budget on a commute network of counties
在县通勤网络上分配 COVID-19 检测预算
  • DOI:
    10.1002/sta4.441
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    1.7
  • 作者:
    Huang, Yaxuan;Ke, Zheng Tracy;Jin, Jiashun
  • 通讯作者:
    Jin, Jiashun
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Zheng Ke其他文献

Strong, ductile and lightweight bionanocomposites constructed by bioinspired hierarchical assembly
通过仿生分层组装构建坚固、延展且轻质的生物纳米复合材料
  • DOI:
    10.1016/j.coco.2019.11.017
  • 发表时间:
    2020-02
  • 期刊:
  • 影响因子:
    8
  • 作者:
    Zhang Wenwen;Zheng Ke;Ren Jing;Fan Yimin;Ling Shengjie
  • 通讯作者:
    Ling Shengjie
Effects of Liquid Flow Rate and Surface-to-nozzle Distance on Non-boiling Heat Transfer Performance in Spray Cooling
  • DOI:
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zheng Ke
  • 通讯作者:
    Zheng Ke
Sox30 initiates transcription of haploid genes during late meiosis and spermiogenesis in mouse testes (vol 145, dev164855, 2018)
  • DOI:
    10.1242/dev.179978
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
  • 作者:
    Bai Shun;Fu Kaiqiang;Yin Huiqi;Cui Yiqiang;Yue Qiuling;Li Wenbo;Cheng Le;Tan Huanhuan;Liu Xiaofei;Guo Yueshuai;Zhang Yingwen;Xie Jie;He Wenxiu;Wang Yuanyuan;Feng Hua;Xin Changpeng;Zhang Jinwen;Lin Mingyan;Shen Bin;Sun Zheng;Guo Xuejiang;Zheng Ke;Ye Lan
  • 通讯作者:
    Ye Lan
The impacts of water diversion on hydrodynamic regulation of plain river network
调水对平原河网水动力调节的影响
  • DOI:
    10.18307/2021.0212
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yu Shan;L. Yiping;Chen Yixin;Shi Yuanyuan;Cheng Yue;H. Yanan;Zhu Ya;Pan Hongzhe;Yue Zhenwu;Zheng Ke
  • 通讯作者:
    Zheng Ke
Nanoscale Hierarchically Porous Metal-Organic Frameworks: Facile Synthesis, Mechanism Research, and Application
纳米级多孔金属有机框架:简易合成、机理研究和应用
  • DOI:
    10.1021/acssuschemeng.8b06560
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    8.4
  • 作者:
    Li Feier;Zheng Ke;Zhang Hang;Duan Chongxiong;Xi Hongxia
  • 通讯作者:
    Xi Hongxia

Zheng Ke的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Zheng Ke', 18)}}的其他基金

Hidden Components in Modern Applications
现代应用中的隐藏组件
  • 批准号:
    1925845
  • 财政年份:
    2018
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Hidden Components in Modern Applications
现代应用中的隐藏组件
  • 批准号:
    1712958
  • 财政年份:
    2017
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
  • 批准号:
    61573081
  • 批准年份:
    2015
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
  • 批准号:
    61572533
  • 批准年份:
    2015
  • 资助金额:
    66.0 万元
  • 项目类别:
    面上项目
E-Learning中学习者情感补偿方法的研究
  • 批准号:
    61402392
  • 批准年份:
    2014
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Understanding conscious and unconscious learning of probabilistic information
理解概率信息的有意识和无意识学习
  • 批准号:
    24K16877
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Probabilistic arrival time prediction algorithm using a-priori knowledge and machine learning to enable sustainable air traffic management
使用先验知识和机器学习的概率到达时间预测算法,以实现可持续的空中交通管理
  • 批准号:
    24K07723
  • 财政年份:
    2024
  • 资助金额:
    $ 40万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CAREER: Accelerating Probabilistic Predictions of Sea-level Rise with Deep Learning
职业:利用深度学习加速海平面上升的概率预测
  • 批准号:
    2238316
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Probabilistic deep learning models and integrated biological experiments for analyzing dynamic and heterogeneous microbiomes
用于分析动态和异质微生物组的概率深度学习模型和集成生物实验
  • 批准号:
    10622713
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
Neural circuit mechanisms of affective probabilistic learning
情感概率学习的神经回路机制
  • 批准号:
    10744542
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
Uncertainty Modeling of Learning to Enable Probabilistic Perception
学习的不确定性建模以实现概率感知
  • 批准号:
    2305532
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
A study on probabilistic models for novel intelligent systems that cope with uncertainty of learning models
应对学习模型不确定性的新型智能系统的概率模型研究
  • 批准号:
    23K03773
  • 财政年份:
    2023
  • 资助金额:
    $ 40万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
RI: Medium: Foundations of Self-Supervised Learning Through the Lens of Probabilistic Generative Models
RI:媒介:通过概率生成模型的视角进行自我监督学习的基础
  • 批准号:
    2211907
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
    Standard Grant
Fast and Furious(ly) Safe: Predicting Intent of Agents on the Road Using Probabilistic Programming and Reinforcement Learning
《速度与激情》安全:使用概率编程和强化学习预测道路上智能体的意图
  • 批准号:
    559891-2021
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Doctoral
Probabilistic Machine Learning Driven Discovery and Design of New Materials for Sustainable Energy and Transport
概率机器学习驱动可持续能源和运输新材料的发现和设计
  • 批准号:
    RGPIN-2018-04642
  • 财政年份:
    2022
  • 资助金额:
    $ 40万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了