CIF: Small: Weakly Supervised Learning

CIF:小:弱监督学习

基本信息

项目摘要

Traditional approaches to pattern recognition require access to labeled training data, consisting of known instances of each class under consideration. Such methods are known as "supervised" because the training labels are assumed to be correct. In many pattern recognition applications, however, precise label information is difficult or impossible to obtain. This research examines classification tasks involving contaminated training data, wherein training examples for some or all classes of interest are contaminated by examples of other classes. Applications include document classification, nuclear nonproliferation, network intrusion detection, drug design, and image and video annotation. When standard classification algorithms are applied in these settings, suboptimal classifiers result. Unfortunately, there currently exists no satisfactory theoretical or methodological framework that simultaneously addresses such classification problems characterized by contaminated data. To address this shortcoming, this research develops a novel framework for the decontamination of mutually contaminated probability distributions, together with associated estimation and classification methods. The decontamination strategy involves projecting observed distributions onto the convex hull of other observed distributions, and recovering the true distributions of interest from the residual of this projection. The projection is with respect to a statistical distance known as the separation distance, and under sufficient conditions on the amount of contamination and purity of the underlying class distributions, this projection procedure successfully recovers the class distributions. This in turn facilitates the design of optimal classifiers. The project examines in detail the problems of classification with noisy labels, anomaly detection, crowdsourcing, semi-supervised learning, domain adaptation, transfer learning, multiple instance learning, and learning from partial labels.
传统的模式识别方法需要访问标记的训练数据,这些数据由所考虑的每个类的已知实例组成。这种方法被称为“监督”,因为训练标签被假设为正确的。然而,在许多模式识别应用中,很难或不可能获得精确的标签信息。本研究考察了涉及污染训练数据的分类任务,其中一些或所有感兴趣的类的训练示例被其他类的示例污染。应用包括文件分类、核不扩散、网络入侵检测、药物设计以及图像和视频注释。当在这些设置中应用标准分类算法时,产生次优分类器。不幸的是,目前还没有令人满意的理论或方法框架,同时解决这些分类问题的特点是污染的数据。为了解决这一缺点,本研究开发了一种新的框架,相互污染的概率分布的去污,以及相关的估计和分类方法。净化策略包括将观测到的分布投影到其他观测到的分布的凸船体上,并从该投影的残差中恢复感兴趣的真实分布。该投影是相对于被称为分离距离的统计距离,并且在关于污染量和底层类分布的纯度的充分条件下,该投影过程成功地恢复了类分布。这反过来又有利于最佳分类器的设计。该项目详细研究了噪声标签分类、异常检测、众包、半监督学习、领域自适应、迁移学习、多实例学习和部分标签学习等问题。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Clayton Scott其他文献

Multiclass Domain Generalization
多类域泛化
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Deshmukh;Srinagesh Sharma;James W. Cutler;Clayton Scott
  • 通讯作者:
    Clayton Scott
The Nested Structure of Cancer Symptoms
癌症症状的嵌套结构
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    1.7
  • 作者:
    S. Bhavnani;G. Bellala;Arunkumaar Ganesan;Rajeev Krishna;Paul R. Saxman;Clayton Scott;Maria J. Silveira;Charles W. Given
  • 通讯作者:
    Charles W. Given
Multilabel proportion prediction and out-of-distribution detection on gamma spectra of short-lived fission products
  • DOI:
    10.1016/j.anucene.2024.110777
  • 发表时间:
    2024-12-01
  • 期刊:
  • 影响因子:
  • 作者:
    Alan Van Omen;Tyler Morrow;Clayton Scott;Elliott Leonard
  • 通讯作者:
    Elliott Leonard

Clayton Scott的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Clayton Scott', 18)}}的其他基金

Collaborative Research: CIF: Small: Learning from Multiple Biased Sources
合作研究:CIF:小型:从多个有偏见的来源学习
  • 批准号:
    2008074
  • 财政年份:
    2020
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
BIGDATA: F: Random and Adaptive Projections for Scalable Optimization and Learning
BIGDATA:F:用于可扩展优化和学习的随机和自适应预测
  • 批准号:
    1838179
  • 财政年份:
    2019
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
CIF: Small: Distribution-Adaptive Prediction and Classification
CIF:小型:分布自适应预测和分类
  • 批准号:
    1217880
  • 财政年份:
    2012
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
CAREER: Guided Sensing
职业:引导传感
  • 批准号:
    0953135
  • 财政年份:
    2010
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Continuing Grant
Learning and Adapting to Spatio-Temporal Anomalies
学习和适应时空异常
  • 批准号:
    0830490
  • 财政年份:
    2008
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
  • 批准号:
    10099896
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
  • 批准号:
    AH/X011747/1
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
  • 批准号:
    MR/Z503757/1
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
  • 批准号:
    BB/Y004426/1
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
  • 批准号:
    ST/Z000017/1
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 49.82万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了