III: Small: Fast Subset Scan for Anomalous Pattern Detection

III:小:用于异常模式检测的快速子集扫描

基本信息

  • 批准号:
    0916345
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-08-01 至 2013-07-31
  • 项目状态:
    已结题

项目摘要

This work will develop new methods for fast and scalable detection of anomalous patterns (subsets of the data that are interesting or unexpected) in massive, multivariate datasets. There will be a focus on real-world applications such as an emerging disease outbreak or a pattern of smuggling activity with complex, subtle, and probabilistic patterns that are difficult to spot with existing techniques. The research is based on two key insights. First, the pattern detection problem can be framed as a search over all subsets of the data, in which can be defined a measure of the "anomalousness" of a subset and then maximize this measure over all potentially relevant subsets. Second, it has been discovered that, for many spatial detection methods (including Kulldor's spatial scan statistic and many recently proposed variants), one can perform an exact search which efficiently maximizes the measure of anomalousness over all subsets of the data. The research team will explore this new combinatorial optimization method, investigate how it can be extended to constrained subset scans and to more general multivariate pattern detection problems, and examine how it can be incorporated into a subset scan framework, enabling the creation a variety of fast, scalable, and useful methods for anomalous pattern detection. Intellectual MeritThe research team will develop, implement, and evaluate a general probabilistic framework for efficient detection of anomalous patterns in both spatial and non-spatial datasets. The proposed work will address these challenging and important research questions:1)How can one define a useful measure of the "anomalousness" of a subset of the data, and efficiently optimize this measure over all subsets to find the most anomalous patterns?2) What are the necessary and sufficient conditions for a set function F (S ) to satisfy the "linear- time subset scanning" (LTSS) property, enabling exact unconstrained optimization of F (S ) over all 2 N subsets of N records while only requiring O(N ) subsets to be evaluated?3) How can one extend fast subset scanning methods to general multivariate datasets, and incorporate search constraints such as proximity, connectivity, and self-similarity?4) How can one deal with uncertainty about the effects of an anomalous pattern by searching over subsets of "input" and "output" attributes as well as subsets of records? Broader ImpactDevelopment and testing will be prioritized in three areas: 1) early detection of disease outbreaks, 2) detecting illicit container shipments, and 3) identifying anomalous trends in social networks. These applications will allow the demonstration the value of these methods across a wide spectrum of domains. Through existing collaborations, the algorithms will be incorporated into deployed systems for health and crime surveillance that contribute directly to the public good. The Principle Investigator's lab has over 5 years of history offering free machine learning software, and the software implementations of all algorithms developed through this grant will be made publicly available. The bulk of the funding will go to training graduate students who will become the next generation of researchers to explore new methods for anomalous pattern detection. Key Words: anomalous patterns; pattern detection; fast subset scan; scan statistics; optimization.
这项工作将开发新的方法,用于快速和可扩展地检测大规模多变量数据集中的异常模式(有趣或意外的数据子集)。将重点关注现实世界的应用,例如新出现的疾病爆发或具有复杂,微妙和概率模式的走私活动模式,这些模式很难用现有技术发现。这项研究基于两个关键的见解。首先,模式检测问题可以被定义为在数据的所有子集上的搜索,其中可以定义子集的“不确定性”的度量,然后在所有潜在相关子集上最大化该度量。其次,已经发现,对于许多空间检测方法(包括Kulldor的空间扫描统计和许多最近提出的变体),可以执行精确搜索,其有效地最大化所有数据子集上的不确定性的测量。研究团队将探索这种新的组合优化方法,研究如何将其扩展到受约束的子集扫描和更一般的多元模式检测问题,并研究如何将其纳入子集扫描框架,从而创建各种快速,可扩展和有用的异常模式检测方法。该研究小组将开发,实施和评估一个通用的概率框架,用于有效检测空间和非空间数据集中的异常模式。所提出的工作将解决这些具有挑战性和重要的研究问题:1)如何定义一个有用的测量数据的一个子集的“异常性”,并有效地优化这个措施在所有子集,以找到最异常的模式?2)什么是集合函数F(S)满足“线性时间子集扫描”(LTSS)性质的必要和充分条件,使F(S)在N个记录的所有2N个子集上精确无约束优化,同时只需要O(N)个子集被评估?3)如何将快速子集扫描方法扩展到一般的多变量数据集,并结合搜索约束,如邻近性,连通性和自相似性?4)如何通过搜索“输入”和“输出”属性的子集以及记录的子集来处理异常模式影响的不确定性?更广泛的影响开发和测试将优先考虑三个领域:1)早期发现疾病爆发,2)发现非法集装箱运输,3)识别社交网络中的异常趋势。这些应用程序将允许演示这些方法在广泛领域的价值。通过现有的合作,这些算法将被纳入已部署的健康和犯罪监测系统,直接为公共利益做出贡献。首席研究员的实验室有超过5年的历史,提供免费的机器学习软件,并通过此赠款开发的所有算法的软件实现将公开提供。大部分资金将用于培训研究生,他们将成为下一代研究人员,探索异常模式检测的新方法。关键词:异常模式;模式检测;快速子集扫描;扫描统计;优化。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Daniel Neill其他文献

Identifying Significant Predictive Bias in Classifiers June 2017
识别分类器中的显着预测偏差 2017 年 6 月
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhe Zhang;Daniel Neill
  • 通讯作者:
    Daniel Neill
Anticorps dirigé contre il-17br
Anticorps dirigé against il-17br
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. N. McKenzie;Daniel Neill
  • 通讯作者:
    Daniel Neill
A novel MXI1-NUTM2B fusion detected in an undifferentiated ovarian cancer
  • DOI:
    10.1016/j.gore.2024.101653
  • 发表时间:
    2025-02-01
  • 期刊:
  • 影响因子:
  • 作者:
    Mohammed Elshafey;Malek Ghandour;Rebecca M. Adams;Daniel Neill;Radhika Gogoi
  • 通讯作者:
    Radhika Gogoi

Daniel Neill的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Daniel Neill', 18)}}的其他基金

The impact of thermally-regulated cell wall modifications on Streptococcus pneumoniae pathogenesis
热调节细胞壁修饰对肺炎链球菌发病机制的影响
  • 批准号:
    MR/X009130/1
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Research Grant
FAI: End-To-End Fairness for Algorithm-in-the-Loop Decision Making in the Public Sector
FAI:公共部门算法在环决策的端到端公平性
  • 批准号:
    2040898
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CAREER: Machine Learning and Event Detection for the Public Good
职业:公益机器学习和事件检测
  • 批准号:
    0953330
  • 财政年份:
    2010
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CNS Core: Small: Toward Opportunistic, Fast, and Robust In-Cache AI Acceleration at the Edge
CNS 核心:小型:在边缘实现机会主义、快速且稳健的缓存内 AI 加速
  • 批准号:
    2228028
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Development of spin-echo SANS method for fast measurement of ultra-small-angle neutron scattering information
超小角中子散射信息快速测量自旋回波SANS方法的发展
  • 批准号:
    23K11708
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
FET: Small: AlignMEM: Fast and Efficient DNA Sequence Alignment in Non-Volatile Magnetic RAM
FET:小型:AlignMEM:非易失性磁性 RAM 中快速高效的 DNA 序列比对
  • 批准号:
    2349802
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CRII: FRR: Latch-mediation as a Pathway for Control in Small, Fast Jumping Microrobots
CRII:FRR:闩锁中介作为小型、快速跳跃微型机器人的控制途径
  • 批准号:
    2153327
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
AF : Small : Fast algorithms for LPs, TSP, and Connectivity
AF:小型:LP、TSP 和连接的快速算法
  • 批准号:
    2129816
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
EAGER: III: Small: Green Granular Neural Networks with Fast FPGA-based Incremental Transfer Learning
EAGER:III:小型:具有基于 FPGA 的快速增量迁移学习的绿色粒度神经网络
  • 批准号:
    2234227
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Fast or Dynamic Websites? Eliminating the Need to Choose
CNS 核心:小型:快速还是动态网站?
  • 批准号:
    2101881
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CIF: Small: Secure and Fast Federated Low-Rank Recovery from Few Column-wise Linear, or Quadratic, Projections
CIF:小型:通过少量列线性或二次投影进行安全快速的联合低秩恢复
  • 批准号:
    2115200
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CNS Core: Small: Fast or Dynamic Websites? Eliminating the Need to Choose
CNS 核心:小型:快速还是动态网站?
  • 批准号:
    2151630
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Collaborative Research: MFB: Ultra-Fast Development of Portable Small Molecule Sensor-Actuators
合作研究:MFB:便携式小分子传感器执行器的超快速开发
  • 批准号:
    2128016
  • 财政年份:
    2021
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了