III: Small: Collaborative Research: A novel paradigm for detecting complex anomalous patterns in multi-modal, heterogeneous, and high-dimensional multi-source data sets

III:小型:协作研究:一种检测多模态、异构和高维多源数据集中复杂异常模式的新范式

基本信息

  • 批准号:
    1954409
  • 负责人:
  • 金额:
    $ 20.59万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-09-01 至 2022-08-31
  • 项目状态:
    已结题

项目摘要

One of the greatest challenges in modern data analysis is to identify subtle, complex anomalous patterns (subsets of a data set that are novel or unexpected) within ubiquitous multi-modal, heterogeneous, and high-dimensional multi-source data sets in the current big data era. The detection of such salient patterns is an indispensable tool for knowledge mining and discovery in important applications across many fields of science, engineering, and business, including the early detection of infectious disease outbreaks, crime hotspots, network intrusions, false advertising, cyber botnets, customer activity monitoring and user profiling, and fraudulent medical claims, among others. The project research goal is to develop a new and innovative paradigm for discovering complex and subtle anomalous patterns in ubiquitous multi-modal, heterogeneous, and high-dimensional multi-source datasets in the current big data era. The key idea is to generalize the idea of meta-analysis from the statistical community and to reframe the problem as a search over all subsets of nonparametric statistical tests that are conducted on individual record-level features, in order to find the subsets (anomalous patterns) that are jointly significant. The project is focused on real-world problems related to biosurveillance and cybersecurity with two challenging applications: early detection of rare and infectious disease outbreaks (e.g., foodborne, Hantavirus, yellow fever) and Sybil attacks (e.g., spammers, fake users, and compromised normal users). The integrated education plan includes the development of new courses offered at the Master of Science program in Computer Science and Informatics and outreach to underrepresented groups. The outcomes of this project will be widely disseminated to broader audience via tutorials and workshops.The research objectives of this project are: (1) the development of nonparametric tests for modeling anomalous information of multi-source datasets; (2) learning heterogeneous dependencies among nonparametric tests; (3) detecting anomalous patterns from an extremely large set of nonparametric tests; and (4) making the detected anomalous patterns interpretable in the context of multi-modal, heterogeneous, and high-dimensional data. The research approach includes the development of (1) nonparametric tests on individual record level features that provide consistent representations of anomalous information from multiple heterogeneous input modalities, such as image, text, video, and multiple sensor streams; (2) deep structured and adversarial methods capable of learning robust hierarchical dependency structures of nonparametric tests using unlabeled training data; (3) fast, scalable combinatorial optimization methods capable of accurately detecting salient anomalous patterns from billion-size nonparametric tests; and (4) transparent and interpretable methods capable of explaining the predicted anomalous patterns by identifying training instances and features that are most responsible for the predictions.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代数据分析面临的最大挑战之一是在当前大数据时代无处不在的多模态、异构和高维多源数据集中识别微妙的、复杂的异常模式(数据集的新颖或意外子集)。这些显著模式的检测是在科学、工程和商业许多领域的重要应用中进行知识挖掘和发现的不可或缺的工具,包括传染病爆发、犯罪热点、网络入侵、虚假广告、网络僵尸网络、客户活动监控和用户分析以及欺诈性医疗索赔等的早期检测。项目研究目标是在当前大数据时代,为发现无处不在的多模态、异构、高维多源数据集中复杂微妙的异常模式,开发一种新的创新范式。关键思想是从统计界推广元分析的思想,并将问题重新定义为对单个记录级别特征进行的非参数统计测试的所有子集进行搜索,以便找到共同显著的子集(异常模式)。该项目侧重于与生物监测和网络安全相关的现实问题,有两个具有挑战性的应用:早期发现罕见和传染病暴发(例如,食源性疾病、汉坦病毒、黄热病)和Sybil攻击(例如,垃圾邮件发送者、假用户和受损的正常用户)。综合教育计划包括开发计算机科学与信息学理学硕士项目提供的新课程,以及向代表性不足的群体提供服务。该项目的成果将通过教程和讲习班向更广泛的受众广泛传播。本课题的研究目标是:(1)开发多源数据集异常信息建模的非参数检验方法;(2)学习非参数检验之间的异质依赖关系;(3)从一组非常大的非参数测试中检测异常模式;(4)使检测到的异常模式在多模态、异构和高维数据环境下具有可解释性。研究方法包括:(1)对单个记录级特征进行非参数测试,这些特征提供来自多个异构输入模式(如图像、文本、视频和多个传感器流)的异常信息的一致表示;(2)深度结构化和对抗方法,能够学习使用未标记训练数据的非参数测试的鲁棒分层依赖结构;(3)快速、可扩展的组合优化方法,能够准确地从十亿规模的非参数测试中检测出显著异常模式;(4)透明和可解释的方法,能够通过识别最负责预测的训练实例和特征来解释预测的异常模式。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Primal-Dual Subgradient Approach for Fair Meta Learning
Block-Structured Optimization for Anomalous Pattern Detection in Interdependent Networks
Distributionally Robust Optimization for Deep Kernel Multiple Instance Learning
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hitesh Sapkota;Yiming Ying;F. Chen;Qi Yu
  • 通讯作者:
    Hitesh Sapkota;Yiming Ying;F. Chen;Qi Yu
Fairness-Aware Online Meta-learning
公平意识在线元学习
Calibrated Nonparametric Scan Statistics for Anomalous Pattern Detection in Graphs
用于图形中异常模式检测的校准非参数扫描统计
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Feng Chen其他文献

In situ self-transformation synthesis of g-C3N4-modified CdS heterostructure with enhanced photocatalytic activity
原位自转化合成具有增强光催化活性的g-C3N4修饰的CdS异质结构
  • DOI:
    10.1016/j.apsusc.2015.06.074
  • 发表时间:
    2015-12
  • 期刊:
  • 影响因子:
    6.7
  • 作者:
    Huogen Yu;Fengyun Chen;Feng Chen;Xuefei Wang
  • 通讯作者:
    Xuefei Wang
Determination of iodine in seawater: methods and applications
海水中碘的测定:方法和应用
  • DOI:
    10.1016/b978-0-12-374135-6.00001-7
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Huabin Li;Xiangrong Xu;Feng Chen
  • 通讯作者:
    Feng Chen
A preliminary investigation of metal element profiles in the serum of patients with bloodstream infections using inductively-coupled plasma mass spectrometry (ICP-MS)
使用电感耦合等离子体质谱 (ICP-MS) 对血流感染患者血清中金属元素谱进行初步研究
  • DOI:
    10.1016/j.cca.2018.07.013
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    5
  • 作者:
    Suying Zhao;Shuyuan Cao;Lan Luo;Zhan Zhang;Gehui Yuan;Yanan Zhang;Yanting Yang;Weihui Guo;Li Wang;Feng Chen;Qian Wu;Lei Li
  • 通讯作者:
    Lei Li
Development and Validation of a Novel Predictive Model for the Early Differentiation of Cardiac and Non-Cardiac Syncope
心源性晕厥和非心源性晕厥早期区分的新型预测模型的开发和验证
  • DOI:
    10.2147/ijgm.s454521
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    2.3
  • 作者:
    Sijin Wu;Zhongli Chen;Yuan Gao;S. Shu;Feng Chen;Ying Wu;Yan Dai;Shu Zhang;Keping Chen
  • 通讯作者:
    Keping Chen
Training of Multi-class Linear Classifier with BFGS Method
用BFGS方法训练多类线性分类器

Feng Chen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Feng Chen', 18)}}的其他基金

ATD: Sparse and Localized Graph Convolutional Networks for Anomaly Detection and Active Learning
ATD:用于异常检测和主动学习的稀疏和局部图卷积网络
  • 批准号:
    2220574
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Hardware and Software Support for Memory-Centric Computing Systems
协作研究:SHF:中:以内存为中心的计算系统的硬件和软件支持
  • 批准号:
    2312509
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Continuing Grant
FAI: A novel paradigm for fairness-aware deep learning models on data streams
FAI:数据流上具有公平意识的深度学习模型的新颖范式
  • 批准号:
    2147375
  • 财政年份:
    2022
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: A New Direction of Research and Development to Fulfill the Promise of Computational Storage
合作研究:SHF:Medium:实现计算存储承诺的研发新方向
  • 批准号:
    2210755
  • 财政年份:
    2022
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: MUDL: Multidimensional Uncertainty-Aware Deep Learning Framework
III:媒介:协作研究:MUDL:多维不确定性感知深度学习框架
  • 批准号:
    2107449
  • 财政年份:
    2021
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Continuing Grant
CAREER: SPARK: A Theoretical Framework for Discovering Complex Patterns in Big Attributed Networks
职业:SPARK:发现大属性网络中复杂模式的理论框架
  • 批准号:
    1954376
  • 财政年份:
    2019
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Continuing Grant
SHF: Small: Redesigning the System Architecture for Ultra-High Density Data Storage
SHF:小型:重新设计超高密度数据存储的系统架构
  • 批准号:
    1910958
  • 财政年份:
    2019
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
CAREER: SPARK: A Theoretical Framework for Discovering Complex Patterns in Big Attributed Networks
职业:SPARK:发现大属性网络中复杂模式的理论框架
  • 批准号:
    1750911
  • 财政年份:
    2018
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: A novel paradigm for detecting complex anomalous patterns in multi-modal, heterogeneous, and high-dimensional multi-source data sets
III:小型:协作研究:一种检测多模态、异构和高维多源数据集中复杂异常模式的新范式
  • 批准号:
    1815696
  • 财政年份:
    2018
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
XPS: FULL: Collaborative Research: Maximizing the Performance Potential and Reliability of Flash-based Solid State Devices for Future Storage Systems
XPS:完整:协作研究:最大限度地提高未来存储系统基于闪存的固态设备的性能潜力和可靠性
  • 批准号:
    1629291
  • 财政年份:
    2016
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336768
  • 财政年份:
    2024
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324770
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316306
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311598
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324769
  • 财政年份:
    2023
  • 资助金额:
    $ 20.59万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了