Robust Classification and uncertainty quantification for non-iid samples

非独立同分布样本的稳健分类和不确定性量化

基本信息

  • 批准号:
    2310836
  • 负责人:
  • 金额:
    $ 16万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-09-01 至 2026-08-31
  • 项目状态:
    未结题

项目摘要

Although advancements in machine learning have significantly improved classification accuracy in various applications, recent research has expanded the focus beyond solely prediction accuracy. There is now an increased emphasis on the necessity for robust quantification of prediction uncertainty, self-awareness in handling abnormal samples, and the ability of classification models to generalize to minor or novel populations. Addressing challenges in these settings, where the traditional independent and identically distributed (IID) data generating assumption no longer holds, is crucial for effectively applying machine learning techniques in safety-critical and fairness-critical systems, such as medical diagnosis or policy making. The project will also contribute to the training of students through their involvement in the research. This project aims to advance robust methods for inferring class labels and quantifying uncertainty under complex non-IID settings by employing techniques from distributionally robust optimization, fairness learning, conformal prediction, and semi-supervised learning. The project will propose innovative classification strategies that exhibit improved worst-group performance across latent sub-populations and enhanced fairness with respect to potentially latent sensitive attributes. These strategies will be integrated with state-of-the-art machine learning techniques, including neural networks and gradient boosting, to develop robust, generalizable, and flexible machine learning algorithms. Additionally, the project will develop novel adaptive classification strategies and investigate their theoretical guarantees. These strategies will leverage both labeled training data and unlabeled test samples. Finally, the project aims to facilitate the in-depth application of the developed methods in safety-critical and fairness-critical systems, particularly in the domains of medical and immunological studies.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
尽管机器学习的进步在各种应用程序中已大大提高了分类精度,但最近的研究将重点扩大到了仅仅预测准确性之外。现在,人们越来越重视预测不确定性,处理异常样本中的自我意识以及分类模型推广到次要或新型人群的能力的必要性。解决这些环境中的挑战,在这种情况下,传统的独立和相同分布(IID)的数据生成假设不再存在,对于有效地将机器学习技术应用于安全至关重要的关键性和关键性系统(例如医学诊断或政策制定)至关重要。该项目还将通过参与研究来为学生培训。该项目旨在通过采用分布强大的优化,公平性学习,结构性预测和半义务学习的技术来推动强大的方法来推断班级标签和量化复杂非IID设置下的不确定性。该项目将提出创新的分类策略,这些策略在潜在的潜在敏感属性方面表现出了在潜在的亚种群中提高了最差的群体表现,并增强了公平性。这些策略将与最先进的机器学习技术(包括神经网络和梯度提升)集成,以开发可靠,可推广和灵活的机器学习算法。此外,该项目将制定新颖的自适应分类策略并研究其理论保证。这些策略将利用标记的培训数据和未标记的测试样本。最后,该项目旨在促进开发方法在安全至关重要和关键性系统中的深入应用,尤其是在医学和免疫学研究领域。该奖项反映了NSF的法定任务,并被认为是通过基金会的知识分子优点和更广泛的影响审查标准来通过评估来通过评估来支持的。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Smooth and probabilistic PARAFAC model with auxiliary covariates
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Leying Guan其他文献

Sex differences in symptomatology and immune profiles of Long COVID
长新冠病毒症状和免疫特征的性别差异
  • DOI:
    10.1101/2024.02.29.24303568
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Julio Silva;Takehiro Takahashi;Jamie Wood;Peiwen Lu;Alexandra Tabachnikova;Jeff R Gehlhausen;Kerrie Greene;Bornali Bhattacharjee;V. Monteiro;C. Lucas;Rahul M. Dhodapkar;L. Tabacof;Mario A. Peña;Kathy Kamath;Tianyang Mao;Dayna Mccarthy;Ruslan Medzhitov;David van Dijk;H. Krumholz;Leying Guan;D. Putrino;Akiko Iwasaki
  • 通讯作者:
    Akiko Iwasaki
Flexible Fairness Learning via Inverse Conditional Permutation
通过逆条件排列的灵活公平学习
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuheng Lai;Leying Guan
  • 通讯作者:
    Leying Guan
Conformal prediction with localization
  • DOI:
  • 发表时间:
    2019-08
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Leying Guan
  • 通讯作者:
    Leying Guan
A smoothed and probabilistic PARAFAC model with covariates
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Leying Guan
  • 通讯作者:
    Leying Guan
A conformal test of linear models via permutation-augmented regressions
  • DOI:
  • 发表时间:
    2023-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Leying Guan
  • 通讯作者:
    Leying Guan

Leying Guan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

基于不确定性分析与知识推理的开放场景地表覆盖分类方法研究
  • 批准号:
    42371374
  • 批准年份:
    2023
  • 资助金额:
    46 万元
  • 项目类别:
    面上项目
面向不确定性数据的粒度模糊规则建模与优化方法研究
  • 批准号:
    61906204
  • 批准年份:
    2019
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
湿地高光谱遥感图像小/不确定/多标签样本分类方法及动态监测应用研究
  • 批准号:
    61977022
  • 批准年份:
    2019
  • 资助金额:
    59 万元
  • 项目类别:
    面上项目
面向不确定性多源异构数据融合分类方法的小微企业信用评级研究
  • 批准号:
    71901044
  • 批准年份:
    2019
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目
多分类器组合支持下的山地森林覆盖类型分类与不确定性研究
  • 批准号:
    41801332
  • 批准年份:
    2018
  • 资助金额:
    24.1 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Determining medications associated with drug-induced pancreatic injury through novel pharmacoepidemiology techniques that assess causation
通过评估因果关系的新型药物流行病学技术确定与药物引起的胰腺损伤相关的药物
  • 批准号:
    10638247
  • 财政年份:
    2023
  • 资助金额:
    $ 16万
  • 项目类别:
Multimodal Label-Free Nanosensor for Single Virus Characterization and Content Analysis
用于单一病毒表征和内容分析的多模式无标记纳米传感器
  • 批准号:
    10641529
  • 财政年份:
    2023
  • 资助金额:
    $ 16万
  • 项目类别:
A data science framework for transforming electronic health records into real-world evidence
将电子健康记录转化为现实世界证据的数据科学框架
  • 批准号:
    10664706
  • 财政年份:
    2023
  • 资助金额:
    $ 16万
  • 项目类别:
Deep Learning Image Analysis Algorithms to Improve Oral Cancer Risk Assessment for Oral Potentially Malignant Disorders
深度学习图像分析算法可改善口腔潜在恶性疾病的口腔癌风险评估
  • 批准号:
    10805177
  • 财政年份:
    2023
  • 资助金额:
    $ 16万
  • 项目类别:
Massively-parallel functional interrogation of genetic variation in CMD-associated alpha-dystroglycan glycosylating enzymes
CMD 相关 α-肌营养不良聚糖糖基化酶遗传变异的大规模并行功能询问
  • 批准号:
    10802855
  • 财政年份:
    2023
  • 资助金额:
    $ 16万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了