Data-driven selection of a convex loss function via shape-constrained estimation

通过形状约束估计来数据驱动选择凸损失函数

基本信息

  • 批准号:
    2311299
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2023
  • 资助国家:
    美国
  • 起止时间:
    2023-07-01 至 2026-06-30
  • 项目状态:
    未结题

项目摘要

This research project focuses on the notion of loss functions, which is central to machine learning and statistics. Loss functions measure the difference between the output predicted by the model and the actual output, and they typically satisfy a property called convexity so that they can be easily optimized. Loss functions quantify how accurate a model is at describing the data and therefore, almost all predictive models are computed by learning model parameters which minimize a given loss function. Choosing a good loss function is vitally important; a good loss function not only improves our predictions, but also allows us to build tighter confidence intervals, and gives us greater robustness to outliers. Although there are general guidelines for choosing a suitable loss function, these guidelines are qualitative and imprecise; most people still default to a few standard choices such as the square error loss. The goal of this project is to develop methods to estimate an optimal convex loss function from the data at hand. We will design, implement, and test algorithms that practitioners can use to automatically obtain loss functions specifically optimized to their dataset, which will allow the practitioners to make better predictive models. Successful execution of this project will have far-reaching effects on standard practices in data science. This project will be deeply integrated with the planned educational components at both the undergraduate and graduate levels.The first component of the project will look at linear regression and show that we can learn a data-driven convex loss function by approximating the unknown noise distribution with a log-concave density in a distributional distance known as the Fisher divergence. The proposed approach is computationally simple and, in settings where the noise is non-Gaussian, significantly improves upon the traditional squared error loss in estimation accuracy, inference quality, and robustness. The second component of the project will extend the idea to the setting of multi-task regression where the response is multivariate. The third component of the project will analyze the theoretical properties of score matching–the statistical method that underpins the first two components on convex loss estimation as well as being of fundamental importance in various other applications in statistical learning.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
这个研究项目的重点是损失函数的概念,这是机器学习和统计的核心。损失函数测量模型预测的输出与实际输出之间的差异,并且它们通常满足称为凸性的属性,以便可以轻松优化。损失函数量化了模型在描述数据时的准确程度,因此,几乎所有的预测模型都是通过学习模型参数来计算的,这些参数使给定的损失函数最小化。选择一个好的损失函数是至关重要的;一个好的损失函数不仅可以提高我们的预测,还可以让我们建立更紧密的置信区间,并为我们提供更好的鲁棒性。虽然有选择合适的损失函数的一般准则,但这些准则是定性的和不精确的;大多数人仍然默认一些标准选择,如平方误差损失。这个项目的目标是开发方法来估计一个最佳的凸损失函数从手头的数据。我们将设计,实现和测试从业者可以使用的算法,以自动获得专门针对其数据集优化的损失函数,这将使从业者能够做出更好的预测模型。该项目的成功实施将对数据科学的标准实践产生深远的影响。该项目将与本科生和研究生阶段的计划教育部分深度整合。该项目的第一部分将研究线性回归,并展示我们可以通过在分布距离中用对数凹密度近似未知噪声分布来学习数据驱动的凸损失函数,称为Fisher散度。所提出的方法是计算简单,在设置中的噪声是非高斯,显着提高了传统的平方误差损失的估计精度,推理质量和鲁棒性。该项目的第二个组成部分将扩展到多任务回归的设置,其中响应是多变量的。该项目的第三个组成部分将分析得分匹配的理论特性--这一统计方法是前两个组成部分关于凸损失估计的基础,并且在统计学习的各种其他应用中具有根本的重要性。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Min Xu其他文献

Aero-structural optimization of supersonic wing under thermal environment using adjoint-based optimization algorithm
基于伴随优化算法的热环境下超音速机翼气动结构优化
Simultaneous measurement of double surfaces of transparent lenses with phase measuring deflectometry
使用相位测量偏转法同时测量透明透镜的双面
  • DOI:
    10.1016/j.optlaseng.2020.106356
  • 发表时间:
    2021-02
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Junqiang Ye;Zhenqi Niu;Xiangchao Zhang;Wei Wang;Min Xu
  • 通讯作者:
    Min Xu
Outcome of split‐liver transplantation from pediatric donors weighing 25 kg or less
体重 25 公斤或以下的儿科捐献者的分割式肝移植的结果
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    4.6
  • 作者:
    Zhen Wang;W. Gao;C. Dong;Chao Sun;Kai Wang;Wei Zhang;Zhuolun Song;H. Qin;C. Han;Yang Yang;Fubo Zhang;Min Xu;W. Zheng;Z. Shen
  • 通讯作者:
    Z. Shen
Design and Implementation of Power System Grounding Grid Fault System Based on Fuzzy Control Algorithm
基于模糊控制算法的电力系统接地网故障系统的设计与实现
(Invited) ALD High-k as a Common Gate Stack Solution for Nanoelectronics
(特邀)ALD High-k 作为纳米电子学的共栅堆栈解决方案
  • DOI:
    10.1149/1.3372563
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    P. Ye;J. Gu;Yanqing Wu;Min Xu;Y. Xuan;T. Shen;A. Neal
  • 通讯作者:
    A. Neal

Min Xu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Min Xu', 18)}}的其他基金

CAREER: Cryo-electron tomography derived multiscale integrative modeling of subcellular organization
职业:冷冻电子断层扫描衍生的亚细胞组织多尺度综合模型
  • 批准号:
    2238093
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
Collaborative Research: III: Medium: Systematic De Novo Identification of Macromolecular Complexes in Cryo-Electron Tomography Images
合作研究:III:介质:冷冻电子断层扫描图像中大分子复合物的系统从头识别
  • 批准号:
    2211597
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Inferring the Past on Markovian Models of Networks
根据马尔可夫网络模型推断过去
  • 批准号:
    2113671
  • 财政年份:
    2021
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
IIBR Informatics: Reducing the training data annotation cost for learning-based macromolecule identification in cellular electron cryo-tomography
IIBR 信息学:降低细胞电子冷冻断层扫描中基于学习的大分子识别的训练数据注释成本
  • 批准号:
    1949629
  • 财政年份:
    2020
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
III: Small: Improving automation and speed of macromolecule recognition and localization in cryo-electron tomography using unsupervised deep learning
III:小:使用无监督深度学习提高冷冻电子断层扫描中大分子识别和定位的自动化程度和速度
  • 批准号:
    2007595
  • 财政年份:
    2020
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
I-Corps: Chemometric fluorescence microscopic imaging and virtual staining for rapid label-free histopathology
I-Corps:化学计量荧光显微成像和虚拟染色,用于快速无标记组织病理学
  • 批准号:
    2017396
  • 财政年份:
    2020
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
RUI: Cell Growth Laws and Quantitative Microscopy for Cancer Aggressiveness Imaging
RUI:细胞生长规律和癌症侵袭性成像的定量显微镜
  • 批准号:
    1920617
  • 财政年份:
    2018
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
RUI: Cell Growth Laws and Quantitative Microscopy for Cancer Aggressiveness Imaging
RUI:细胞生长规律和癌症侵袭性成像的定量显微镜
  • 批准号:
    1607664
  • 财政年份:
    2017
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
基于Cache的远程计时攻击研究
  • 批准号:
    60772082
  • 批准年份:
    2007
  • 资助金额:
    28.0 万元
  • 项目类别:
    面上项目

相似海外基金

A Modular Framework for Data-Driven Neurogenetics to Predict Complex and Multidimensional Autistic Phenotypes
数据驱动神经遗传学预测复杂和多维自闭症表型的模块化框架
  • 批准号:
    10826595
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
Establishing Multimodal Brain Biomarkers Using Data-driven Analyticsfor Treatment Selection in Depression
使用数据驱动分析建立多模式脑生物标志物以选择抑郁症的治疗方法
  • 批准号:
    10660219
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
Unsupervised Statistical Methods for Data-driven Analyses in Spatially Resolved Transcriptomics Data
空间分辨转录组数据中数据驱动分析的无监督统计方法
  • 批准号:
    10556351
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
Human-informed data-driven development of next-generation T cell vaccine against malaria
以人为本的数据驱动开发下一代抗疟疾 T 细胞疫苗
  • 批准号:
    10443906
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
Human-informed data-driven development of next-generation T cell vaccine against malaria
以人为本的数据驱动开发下一代抗疟疾 T 细胞疫苗
  • 批准号:
    10756179
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
Unsupervised Statistical Methods for Data-driven Analyses in Spatially Resolved Transcriptomics Data
空间分辨转录组数据中数据驱动分析的无监督统计方法
  • 批准号:
    10350850
  • 财政年份:
    2022
  • 资助金额:
    $ 20万
  • 项目类别:
Data-driven subtyping in major depressive disorder
重度抑郁症的数据驱动亚型
  • 批准号:
    10393687
  • 财政年份:
    2021
  • 资助金额:
    $ 20万
  • 项目类别:
Data-driven subtyping in major depressive disorder
重度抑郁症的数据驱动亚型
  • 批准号:
    10580741
  • 财政年份:
    2021
  • 资助金额:
    $ 20万
  • 项目类别:
Data-driven subtyping in major depressive disorder
重度抑郁症的数据驱动亚型
  • 批准号:
    10211310
  • 财政年份:
    2021
  • 资助金额:
    $ 20万
  • 项目类别:
Identification of Distinct Multimodal Biotypes of PTSD Using Data Driven Approach: A Multisite Big Data Study
使用数据驱动方法识别 PTSD 的独特多模式生物型:多站点大数据研究
  • 批准号:
    10317107
  • 财政年份:
    2020
  • 资助金额:
    $ 20万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了