CIF: RI: Small: Information-theoretic measures of dependencies and novel sample-based estimators

CIF:RI:小:依赖性的信息论测量和新颖的基于样本的估计器

基本信息

  • 批准号:
    1815535
  • 负责人:
  • 金额:
    $ 45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-08-15 至 2019-07-31
  • 项目状态:
    已结题

项目摘要

Measures of dependencies play central roles in discovering associations between variables that leads to scientific discoveries. In practice, analysts need to compute these measures from data, which can be challenging. The standard estimators can fail when, for example, the data has a mixture of continuous and discrete variables, or when the data lies on a complex space with abundant boundaries. The aim of this project is to address practical issues in estimating measures of dependencies, and provide novel estimators to overcome these challenges. The success of the proposed work will result in novel estimators for discovering new aspects of data. The immediate impact is in two specific contexts: discovering correlations in biological datasets and analyzing the inner-workings of deep neural networks; the lasting impact will be in diverse fields including genomic, biology, machine learning, and artificial intelligence. This project also integrates research with education through the creation of a graduate course on statistical learning. In addition, the project will offer undergraduates the opportunity to be involved in research.This proposal addresses two fundamental questions: designing novel estimators for information theoretic measures and designing novel estimators for modern measures of correlation that is defined as a solution of optimization problems. In the former, two major challenges are addressed: variables of mixed type (continuous and discrete) and boundary biases. Borrowing techniques from local log-likelihood density estimators, nearest neighbor methods, and order statistics, this leads to a new estimator that can adapt to the local geometry of the distributions in a principled way, that improves significantly over existing estimators. In modern data analysis, several measures of correlations are naturally defined as solutions of optimization problems, making them challenging to estimate. This proposal aims to provide a principled approach and propose a new estimator borrowing insights from importance sampling and nearest neighbor methods. The proposed framework is applied to estimate hypercontractivity ratio, an information theoretic quantity that captures hidden correlations in the data and is naturally defined as a solution of an infinite dimensional optimization. The proposed measure of hypercontractivity is shown to discover potential correlations that other standard measures are not able to, in canonical synthetic examples and real datasets.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
相关性的测量在发现导致科学发现的变量之间的关联方面发挥着核心作用。在实践中,分析师需要根据数据计算这些指标,这可能是具有挑战性的。例如,当数据既有连续变量又有离散变量时,或者当数据位于具有丰富边界的复杂空间时,标准估计器可能会失败。这个项目的目的是解决在估计相关性度量方面的实际问题,并提供新的估计器来克服这些挑战。拟议工作的成功将导致发现数据新方面的新估计器。直接的影响是在两个特定的背景下:发现生物数据集中的相关性和分析深度神经网络的内部工作原理;持久的影响将在包括基因组、生物学、机器学习和人工智能在内的不同领域产生。该项目还通过开设一个关于统计学习的研究生课程,将研究与教育结合起来。此外,该项目将为本科生提供参与研究的机会。这项建议解决了两个基本问题:为信息论指标设计新的估计器,为现代相关性指标设计新的估计器,这被定义为优化问题的解决方案。在前者中,解决了两大挑战:混合型变量(连续和离散)和边界偏差。借鉴了局部对数似然密度估计量、最近邻方法和顺序统计量的技术,得到了一种新的估计量,它能够以一种原则性的方式适应分布的局部几何,比现有的估计量有显著的改善。在现代数据分析中,几个相关性的度量自然被定义为优化问题的解决方案,这使得它们具有估计的挑战性。这一建议旨在提供一种原则性的方法,并借鉴重要性抽样和最近邻方法的见解,提出一种新的估计器。提出的框架被应用于估计超缩率,超缩率是捕捉数据中隐藏的相关性的信息理论量,自然地被定义为无限维优化的解。拟议的过度收缩措施被证明是为了发现其他标准措施在规范的合成例子和真实数据集中无法发现的潜在相关性。这一奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sewoong Oh其他文献

Spectrum Estimation from a Few Entries
从几个条目进行频谱估计
  • DOI:
    10.1016/j.aml.2021.107342
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Khetan;Sewoong Oh
  • 通讯作者:
    Sewoong Oh
Proceedings of the 2017 ACM SIGMETRICS / International Conference on Measurement and Modeling of Computer Systems
2017 年 ACM SIGMETRICS/计算机系统测量和建模国际会议论文集
Matrix Norm Estimation from a Few Entries
根据几个条目进行矩阵范数估计
A transformer model for de novo sequencing of data-independent acquisition mass spectrometry data
用于数据非依赖采集质谱数据从头测序的变压器模型
  • DOI:
    10.1038/s41592-025-02718-y
  • 发表时间:
    2025-07-01
  • 期刊:
  • 影响因子:
    32.100
  • 作者:
    Justin Sanders;Bo Wen;Paul A. Rudnick;Richard S. Johnson;Christine C. Wu;Michael Riffle;Sewoong Oh;Michael J. MacCoss;William Stafford Noble
  • 通讯作者:
    William Stafford Noble
Comparison of maxillary basal arch forms using the root apex in adult women with different skeletal patterns: A pilot study.
使用具有不同骨骼模式的成年女性的根尖比较上颌基弓形状:一项试点研究。

Sewoong Oh的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sewoong Oh', 18)}}的其他基金

Collaborative Research: MLWiNS: Physical Layer Communication revisited via Deep Learning
合作研究:MLWiNS:通过深度学习重新审视物理层通信
  • 批准号:
    2002664
  • 财政年份:
    2020
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CIF: RI: Small: Information-theoretic measures of dependencies and novel sample-based estimators
CIF:RI:小:依赖性的信息论测量和新颖的基于样本的估计器
  • 批准号:
    1929955
  • 财政年份:
    2019
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
CAREER: Social Computation: Fundamental Limits and Efficient Algorithms
职业:社会计算:基本限制和高效算法
  • 批准号:
    1927712
  • 财政年份:
    2019
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
CAREER: Social Computation: Fundamental Limits and Efficient Algorithms
职业:社会计算:基本限制和高效算法
  • 批准号:
    1553452
  • 财政年份:
    2016
  • 资助金额:
    $ 45万
  • 项目类别:
    Continuing Grant
TWC: Small: Fundamental Limits in Differential Privacy
TWC:小:差异隐私的基本限制
  • 批准号:
    1527754
  • 财政年份:
    2015
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
EAGER: A Graphical Approach for Choice Modeling
EAGER:选择建模的图形方法
  • 批准号:
    1450848
  • 财政年份:
    2015
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant

相似国自然基金

醒脑静多靶点调控PI3K/Akt通路抑制CI/RI氧化应激—基于网络药理学及体内、外实验研究
  • 批准号:
    2025JJ90117
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
IgA-FcαRI介导的Syk/NLRP3/caspase-1通路在线状IgA大疱性皮病 中的机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于双修饰ANG-RNH1系统阻抑RI复合物生成机制建立口腔黏膜等效物血管化稳态
  • 批准号:
    82401112
  • 批准年份:
    2024
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
跨膜蛋白LRP5胞外域调控膜受体TβRI促钛表面BMSCs归巢、分化的研究
  • 批准号:
    82301120
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于“免疫-神经”网络探讨眼针活化CI/RI大鼠MC靶向H3R调节“免疫监视”的抗炎机制
  • 批准号:
    82374375
  • 批准年份:
    2023
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
Dectin-2通过促进FcεRI聚集和肥大细胞活化加剧哮喘发作的机制研究
  • 批准号:
    82300022
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
藏药甘肃蚤缀β-咔啉生物碱类TβRI抑制剂的发现及其抗肺纤维化作用机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
nCs通过TβRI结合并磷酸化Axin促进颌骨成骨反应的作用及机制研究
  • 批准号:
    2022J011347
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
TβRI的UFM化修饰调控TGF-β信号通路和乳腺癌转移的作用及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于 FcεRI 信号通路介导的肥大细胞脱颗粒过程研究支气管哮喘的机制及中药干预
  • 批准号:
    2022JJ70115
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

RI: Small: Understanding Hand Interaction In The Jumble of Internet Videos
RI:小:在混乱的互联网视频中理解手部交互
  • 批准号:
    2426592
  • 财政年份:
    2024
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Foundations of Few-Round Active Learning
协作研究:RI:小型:少轮主动学习的基础
  • 批准号:
    2313131
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Travel: RI: Small: Student Travel Grant for 20th International Conference on Principles of Knowledge Representation and Reasoning and Doctoral Consortium
旅费:RI:小额:第 20 届知识表示和推理原理及博士联盟国际会议学生旅费补助
  • 批准号:
    2328173
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Deep Constrained Learning for Power Systems
合作研究:RI:小型:电力系统的深度约束学习
  • 批准号:
    2345528
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Motion Fields Understanding for Enhanced Long-Range Imaging
合作研究:RI:小型:增强远程成像的运动场理解
  • 批准号:
    2232298
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232055
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Small: Large-Scale Game-Theoretic Reasoning with Incomplete Information
RI:小型:不完整信息的大规模博弈论推理
  • 批准号:
    2214141
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
CISE-ANR: RI: Small: Numerically efficient reinforcement learning for constrained systems with super-linear convergence (NERL)
CISE-ANR:RI:小:具有超线性收敛 (NERL) 的约束系统的数值高效强化学习
  • 批准号:
    2315396
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
RI: Small: The Surprising Power of Sequential Fair Allocation Mechanisms
RI:小:顺序公平分配机制的惊人力量
  • 批准号:
    2327057
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: End-to-end Learning of Fair and Explainable Schedules for Court Systems
合作研究:RI:小型:法院系统公平且可解释的时间表的端到端学习
  • 批准号:
    2232054
  • 财政年份:
    2023
  • 资助金额:
    $ 45万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了