III: Small: Learning From Diverse Populations: A Complexity-Theoretic Perspective

III:小:向不同人群学习:复杂性理论的视角

基本信息

  • 批准号:
    1908774
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2023-09-30
  • 项目状态:
    已结题

项目摘要

Despite the successes of machine learning at complex prediction and classification tasks (such as which add a reader will click? or which word a speaker pronounced?), there is growing evidence that "state-of-the-art" predictors can perform significantly less accurately on minority populations than on the majority population. Indeed, a notable study of three commercial face recognition systems, known as the "Gender Shades" project demonstrated significant performance gaps across different subpopulations at natural classification tasks. Systematic errors on underrepresented subpopulations limit the overall utility of machine-learned prediction systems and may cause material harm to individuals from minority groups. To address accuracy disparity and systematic biases throughout machine learning, the project pursue a principled study of learning in the presence of diverse populations. The project puts high value on education, service to the research community, and wide dissemination of knowledge. The research activities will be accompanied by and integrated with curriculum development, research advising (for students at all levels), service, and outreach to other scientific communities and in popular writing. In addition, in the age of machine-learning and big data, the project's societal impact is twofold: making sure that algorithms work for everyone but also making sure algorithms uncover all potential talent, which exists in all communities.The project combines theoretical and empirical investigations to develop algorithmic tools for mitigating systematic bias across subpopulations and to answer basic scientific questions about why discrepancy in accuracy across subpopulations emerges in the first place. Specifically, the project aims to ask and resolve questions that arise in the context of learning from diverse populations along three main axes: (1) Improving predictions for underrepresented populations: Can learning algorithms be developed that provably do not overlook significant subpopulations, (2) Representing individuals to improve the ability to audit and repair models, (3) Understanding the causes for biases in machine common learning models and algorithms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
尽管机器学习在复杂的预测和分类任务上取得了成功(比如读者会点击哪个添加?或者说是一个说话者说的什么话?)越来越多的证据表明,“最先进的”预测器对少数群体的准确性可能远远低于对多数群体的准确性。事实上,一项针对三种商业人脸识别系统的著名研究(被称为“性别阴影”项目)表明,不同亚群在自然分类任务中存在显著的性能差距。代表性不足的亚群的系统性错误限制了机器学习预测系统的整体效用,并可能对少数群体的个人造成重大伤害。为了解决整个机器学习过程中的准确性差异和系统性偏差,该项目对存在不同人群的学习进行了原则性研究。该项目高度重视教育、为研究界服务和广泛传播知识。研究活动将伴随并与课程开发,研究咨询(为各级学生),服务和推广到其他科学界和流行的写作相结合。此外,在机器学习和大数据时代,该项目的社会影响是双重的:确保算法对每个人都有效,同时也确保算法发现所有潜在的人才,该项目结合了理论和实证调查,开发算法工具,以减轻亚群之间的系统性偏差,并回答有关为什么不同群体之间的准确性差异的基本科学问题。亚群首先出现。具体而言,该项目旨在提出和解决在向不同人群学习的背景下出现的问题,沿着三个主轴:(1)改善对代表性不足人群的预测:学习算法能否被开发出来,证明不会忽视重要的子群体,(2)代表个人,以提高审计和修复模型的能力,(3)了解机器常见学习模型和算法中偏见的原因。该奖项反映了NSF的法定使命,并且通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(25)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Non-Asymptotic Moreau Envelope Theory for High-Dimensional Generalized Linear Models
高维广义线性模型的非渐近莫罗包络理论
Sample Amplification: Increasing Dataset Size even when Learning is Impossible, ICML
样本放大:即使无法学习,也可以增加数据集大小,ICML
Omnipredictors for Constrained Optimization
用于约束优化的全预测器
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hu, Lunjia;Livni Navon, Inbal;Reingold, Omer;Yang, Chutong
  • 通讯作者:
    Yang, Chutong
Subspace Recovery from Heterogeneous Data with Non-isotropic Noise
具有非各向同性噪声的异构数据的子空间恢复
Lower Bounds on Randomly Preconditioned Lasso via Robust Sparse Designs
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jonathan A. Kelner;Frederic Koehler;Raghu Meka;Dhruv Rohatgi
  • 通讯作者:
    Jonathan A. Kelner;Frederic Koehler;Raghu Meka;Dhruv Rohatgi
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Omer Reingold其他文献

Improved pseudorandomness for unordered branching programs through local monotonicity
通过局部单调性改进无序分支程序的伪随机性
Constructing Pseudo-Random Permutations with a Prescribed Structure
构造具有指定结构的伪随机排列
  • DOI:
    10.1007/s00145-001-0008-5
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    3
  • 作者:
    M. Naor;Omer Reingold
  • 通讯作者:
    Omer Reingold
Succinct Proofs for NP and Spooky Interactions
NP 和幽灵交互的简洁证明
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Dwork;M. Langberg;M. Naor;Kobbi Nissim;Omer Reingold
  • 通讯作者:
    Omer Reingold
From the Real Towards the Ideal: Risk Prediction in a Better World
从现实走向理想:美好世界中的风险预测
  • DOI:
    10.4230/lipics.forc.2023.1
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    14
  • 作者:
    C. Dwork;Omer Reingold;G. Rothblum
  • 通讯作者:
    G. Rothblum
Dissenting Explanations: Leveraging Disagreement to Reduce Model Overreliance
不同的解释:利用不同意见来减少模型过度依赖
  • DOI:
    10.48550/arxiv.2307.07636
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Omer Reingold;J. Shen;Aditi Talati
  • 通讯作者:
    Aditi Talati

Omer Reingold的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Omer Reingold', 18)}}的其他基金

AF: Medium: Collaborative Research: Exploiting Opportunities in Pseudorandomness
AF:媒介:协作研究:利用伪随机性中的机会
  • 批准号:
    1763311
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
AF: EAGER: Identifying Opportunities in Pseudorandomness
AF:EAGER:识别伪随机性中的机会
  • 批准号:
    1749810
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: SMALL: Graph Contrastive Learning for Few-Shot Node Classification
III:SMALL:少样本节点分类的图对比学习
  • 批准号:
    2229461
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: A Big Data and Machine Learning Approach for Improving the Efficiency of Two-sided Online Labor Markets
III:小:提高双边在线劳动力市场效率的大数据和机器学习方法
  • 批准号:
    2311582
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III : Small : Integrating and Learning on Spatial Data via Multi-Agent Simulation
III:小:通过多智能体模拟集成和学习空间数据
  • 批准号:
    2311954
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
  • 批准号:
    2321504
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Deep Interactive Reinforcement Learning for Self-optimizing Feature Selection
III:小:用于自优化特征选择的深度交互式强化学习
  • 批准号:
    2152030
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Distributed Reinforcement Learning over Complex Networks
III:小型:复杂网络上的分布式强化学习
  • 批准号:
    2230101
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
EAGER: III: Small: Green Granular Neural Networks with Fast FPGA-based Incremental Transfer Learning
EAGER:III:小型:具有基于 FPGA 的快速增量迁移学习的绿色粒度神经网络
  • 批准号:
    2234227
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Robust Learning and Inference Protocols for Mitigating Information Pollution
合作研究:III:小型:用于减轻信息污染的鲁棒学习和推理协议
  • 批准号:
    2135581
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Robust Learning and Inference Protocols for Mitigating Information Pollution
合作研究:III:小型:用于减轻信息污染的鲁棒学习和推理协议
  • 批准号:
    2135573
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了