III: Small: Collaborative Research: A novel paradigm for detecting complex anomalous patterns in multi-modal, heterogeneous, and high-dimensional multi-source data sets

III:小型:协作研究:一种检测多模态、异构和高维多源数据集中复杂异常模式的新范式

基本信息

  • 批准号:
    1815696
  • 负责人:
  • 金额:
    $ 25万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2018
  • 资助国家:
    美国
  • 起止时间:
    2018-09-01 至 2019-11-30
  • 项目状态:
    已结题

项目摘要

One of the greatest challenges in modern data analysis is to identify subtle, complex anomalous patterns (subsets of a data set that are novel or unexpected) within ubiquitous multi-modal, heterogeneous, and high-dimensional multi-source data sets in the current big data era. The detection of such salient patterns is an indispensable tool for knowledge mining and discovery in important applications across many fields of science, engineering, and business, including the early detection of infectious disease outbreaks, crime hotspots, network intrusions, false advertising, cyber botnets, customer activity monitoring and user profiling, and fraudulent medical claims, among others. The project research goal is to develop a new and innovative paradigm for discovering complex and subtle anomalous patterns in ubiquitous multi-modal, heterogeneous, and high-dimensional multi-source datasets in the current big data era. The key idea is to generalize the idea of meta-analysis from the statistical community and to reframe the problem as a search over all subsets of nonparametric statistical tests that are conducted on individual record-level features, in order to find the subsets (anomalous patterns) that are jointly significant. The project is focused on real-world problems related to biosurveillance and cybersecurity with two challenging applications: early detection of rare and infectious disease outbreaks (e.g., foodborne, Hantavirus, yellow fever) and Sybil attacks (e.g., spammers, fake users, and compromised normal users). The integrated education plan includes the development of new courses offered at the Master of Science program in Computer Science and Informatics and outreach to underrepresented groups. The outcomes of this project will be widely disseminated to broader audience via tutorials and workshops.The research objectives of this project are: (1) the development of nonparametric tests for modeling anomalous information of multi-source datasets; (2) learning heterogeneous dependencies among nonparametric tests; (3) detecting anomalous patterns from an extremely large set of nonparametric tests; and (4) making the detected anomalous patterns interpretable in the context of multi-modal, heterogeneous, and high-dimensional data. The research approach includes the development of (1) nonparametric tests on individual record level features that provide consistent representations of anomalous information from multiple heterogeneous input modalities, such as image, text, video, and multiple sensor streams; (2) deep structured and adversarial methods capable of learning robust hierarchical dependency structures of nonparametric tests using unlabeled training data; (3) fast, scalable combinatorial optimization methods capable of accurately detecting salient anomalous patterns from billion-size nonparametric tests; and (4) transparent and interpretable methods capable of explaining the predicted anomalous patterns by identifying training instances and features that are most responsible for the predictions.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代数据分析中最大的挑战之一是在当前大数据时代普遍存在的多模态,异构和高维多源数据集中识别微妙,复杂的异常模式(数据集的子集)。在科学、工程和商业的许多领域的重要应用中,这种显著模式的检测是知识挖掘和发现的不可或缺的工具,包括传染病爆发、犯罪热点、网络入侵、虚假广告、网络僵尸网络、客户活动监控和用户分析以及欺诈性医疗索赔等的早期检测。该项目的研究目标是开发一种新的创新范式,用于在当前大数据时代的无处不在的多模态,异构和高维多源数据集中发现复杂和微妙的异常模式。其关键思想是从统计界推广荟萃分析的思想,并将问题重新定义为对单个记录级特征进行非参数统计检验的所有子集进行搜索,以找到联合显着的子集(异常模式)。该项目的重点是与生物监测和网络安全有关的现实问题,具有两个具有挑战性的应用:罕见和传染病爆发的早期检测(例如,食源性、汉坦病毒、黄热病)和西比尔攻击(例如,垃圾邮件发送者、假冒用户和受损的正常用户)。综合教育计划包括开发计算机科学和信息学理学硕士课程提供的新课程,并向代表性不足的群体推广。本项目的研究目标是:(1)开发用于多源数据集异常信息建模的非参数检验;(2)学习非参数检验之间的异质依赖性;(3)从极大的非参数检验集合中检测异常模式;(4)从非参数检验集合中检测异常模式;(5)从非参数检验集合中检测异常模式。以及(4)使检测到的异常模式在多模态、异构和高维数据的上下文中可解释。研究方法包括:(1)对单个记录级特征进行非参数测试,这些特征提供来自多种异构输入模式(如图像、文本、视频和多个传感器流)的异常信息的一致表示;(2)能够使用未标记训练数据学习非参数测试的鲁棒分层依赖结构的深度结构化和对抗性方法;(3)能够从十亿大小的非参数测试中准确地检测显著异常模式的快速、可扩展的组合优化方法;以及(4)透明和可解释的方法,能够解释预测的异常模式,通过识别培训实例和功能,是最负责的预测。这个奖项反映了NSF的法定使命,并已被认为是值得支持,通过使用基金会的知识价值和更广泛的影响审查标准进行评估。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Uncovering Specific-Shape Graph Anomalies in Attributed Graphs
  • DOI:
    10.1609/aaai.v33i01.33015433
  • 发表时间:
    2019-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nannan Wu;Wenjun Wang;Feng Chen;Jianxin Li;B. Li;J. Huai
  • 通讯作者:
    Nannan Wu;Wenjun Wang;Feng Chen;Jianxin Li;B. Li;J. Huai
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Feng Chen其他文献

In situ self-transformation synthesis of g-C3N4-modified CdS heterostructure with enhanced photocatalytic activity
原位自转化合成具有增强光催化活性的g-C3N4修饰的CdS异质结构
  • DOI:
    10.1016/j.apsusc.2015.06.074
  • 发表时间:
    2015-12
  • 期刊:
  • 影响因子:
    6.7
  • 作者:
    Huogen Yu;Fengyun Chen;Feng Chen;Xuefei Wang
  • 通讯作者:
    Xuefei Wang
Determination of iodine in seawater: methods and applications
海水中碘的测定:方法和应用
  • DOI:
    10.1016/b978-0-12-374135-6.00001-7
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Huabin Li;Xiangrong Xu;Feng Chen
  • 通讯作者:
    Feng Chen
A preliminary investigation of metal element profiles in the serum of patients with bloodstream infections using inductively-coupled plasma mass spectrometry (ICP-MS)
使用电感耦合等离子体质谱 (ICP-MS) 对血流感染患者血清中金属元素谱进行初步研究
  • DOI:
    10.1016/j.cca.2018.07.013
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    5
  • 作者:
    Suying Zhao;Shuyuan Cao;Lan Luo;Zhan Zhang;Gehui Yuan;Yanan Zhang;Yanting Yang;Weihui Guo;Li Wang;Feng Chen;Qian Wu;Lei Li
  • 通讯作者:
    Lei Li
Development and Validation of a Novel Predictive Model for the Early Differentiation of Cardiac and Non-Cardiac Syncope
心源性晕厥和非心源性晕厥早期区分的新型预测模型的开发和验证
  • DOI:
    10.2147/ijgm.s454521
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    2.3
  • 作者:
    Sijin Wu;Zhongli Chen;Yuan Gao;S. Shu;Feng Chen;Ying Wu;Yan Dai;Shu Zhang;Keping Chen
  • 通讯作者:
    Keping Chen
Training of Multi-class Linear Classifier with BFGS Method
用BFGS方法训练多类线性分类器

Feng Chen的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Feng Chen', 18)}}的其他基金

ATD: Sparse and Localized Graph Convolutional Networks for Anomaly Detection and Active Learning
ATD:用于异常检测和主动学习的稀疏和局部图卷积网络
  • 批准号:
    2220574
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: Hardware and Software Support for Memory-Centric Computing Systems
协作研究:SHF:中:以内存为中心的计算系统的硬件和软件支持
  • 批准号:
    2312509
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
FAI: A novel paradigm for fairness-aware deep learning models on data streams
FAI:数据流上具有公平意识的深度学习模型的新颖范式
  • 批准号:
    2147375
  • 财政年份:
    2022
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Medium: A New Direction of Research and Development to Fulfill the Promise of Computational Storage
合作研究:SHF:Medium:实现计算存储承诺的研发新方向
  • 批准号:
    2210755
  • 财政年份:
    2022
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: MUDL: Multidimensional Uncertainty-Aware Deep Learning Framework
III:媒介:协作研究:MUDL:多维不确定性感知深度学习框架
  • 批准号:
    2107449
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: A novel paradigm for detecting complex anomalous patterns in multi-modal, heterogeneous, and high-dimensional multi-source data sets
III:小型:协作研究:一种检测多模态、异构和高维多源数据集中复杂异常模式的新范式
  • 批准号:
    1954409
  • 财政年份:
    2019
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CAREER: SPARK: A Theoretical Framework for Discovering Complex Patterns in Big Attributed Networks
职业:SPARK:发现大属性网络中复杂模式的理论框架
  • 批准号:
    1954376
  • 财政年份:
    2019
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
SHF: Small: Redesigning the System Architecture for Ultra-High Density Data Storage
SHF:小型:重新设计超高密度数据存储的系统架构
  • 批准号:
    1910958
  • 财政年份:
    2019
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CAREER: SPARK: A Theoretical Framework for Discovering Complex Patterns in Big Attributed Networks
职业:SPARK:发现大属性网络中复杂模式的理论框架
  • 批准号:
    1750911
  • 财政年份:
    2018
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
XPS: FULL: Collaborative Research: Maximizing the Performance Potential and Reliability of Flash-based Solid State Devices for Future Storage Systems
XPS:完整:协作研究:最大限度地提高未来存储系统基于闪存的固态设备的性能潜力和可靠性
  • 批准号:
    1629291
  • 财政年份:
    2016
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336768
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324770
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316306
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311598
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324769
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了