Pattern matching algorithms for streaming data
流数据的模式匹配算法
基本信息
- 批准号:EP/H028056/2
- 负责人:
- 金额:$ 5.46万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Fellowship
- 财政年份:2013
- 资助国家:英国
- 起止时间:2013 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Imagine that I give you the following task: read the Complete Works of Shakespeare and write down all occurrences of the phrase my good lord . The task is known in Computer Science as exact pattern matching; here the phrase my good lord is the pattern. If I asked you to find all phrases similar to the phrase my good lord , you may decide write down the phrases my noble lord , my gracious lord and simply my lord . This is approximate pattern matching, a problem whose complexity is, of course, dependent on how we define the word similar. The definition considered depends on the application and much of the breadth and depth of the field arises from this.Now imagine that I am going to read the Complete Works of Shakespeare to you and expect you to write down similar phrases as you hear them. This is online approximate pattern matching and is the focus of this proposal. The proposal is applicable to Internet related applications where a vast quantity of data passes though a computer constantly - a field known as data streaming. Here the data is far too large to be stored and results must be computed on the fly as the data arrives. In the reading analogy, if you mishear a paragraph, I'm not going to reread it to you.The aim of this proposal is to bring these fields together to search for patterns quickly in streaming data. Continuing the analogy, we will be considering finding patterns in a number of circumstances:1. As before I am going to read you a book but this time much faster. I know that you can't write down all the occurrences fast enough but I want you to guarantee you will catch most of them.2. Many people will read books out loud to you at the same time. Any time any of them say the pattern you are looking, for you have to write it down.3. I am going to read you a book but I make no promise to read the words in order: page 6 line 3 word 6 is good , page 39 line 1 word 2 is happy , page 6 line 3 word 5 is my ...Of course, these problems sound strange and counter-intuitive phrased in plain English, but the underlying Computer Science problems are highly significant for many emerging applications such as traffic shaping, firewalls, Internet monitoring and malicious content detection.
假设我给你以下任务:阅读《莎士比亚全集》,写下“我的好老爷”这个短语出现的所有地方。这项任务在计算机科学中被称为精确模式匹配;在这里,“我的好主”是一种模式。如果我让你找出所有与“我的好主”类似的短语,你可以决定写下“我高贵的主”、“我仁慈的主”和“我的主”。这就是近似模式匹配,当然,这个问题的复杂性取决于我们如何定义“相似”这个词。所考虑的定义取决于应用,该领域的广度和深度在很大程度上源于此。现在想象一下,我要给你们读《莎士比亚全集》,希望你们把听到的类似短语写下来。这是一种在线近似模式匹配,是本方案的重点。该建议适用于与互联网相关的应用程序,其中大量数据不断地通过计算机-一个称为数据流的领域。这里的数据太大,无法存储,必须在数据到达时动态计算结果。在阅读类比中,如果你听错了一段话,我不会再给你读一遍。该建议的目的是将这些领域结合起来,以便在流数据中快速搜索模式。继续这个类比,我们将考虑在许多情况下寻找模式:1。像以前一样,我要给你读一本书,但这次要快得多。我知道你不可能把所有的情况都写下来,但我希望你能保证你能抓住其中的大部分。许多人会同时为你大声朗读。任何时候,他们中的任何一个说出了你正在寻找的模式,因为你必须把它写下来。我要给你读一本书,但我不保证按顺序读:第6页第3行第6行第6行第2行第2行第6行第3行第5行是我的…当然,这些问题听起来很奇怪,用简单的英语来表达是违反直觉的,但是潜在的计算机科学问题对于许多新兴的应用来说是非常重要的,比如流量整形、防火墙、互联网监控和恶意内容检测。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Benjamin Sach其他文献
Pattern matching in pseudo real-time
- DOI:
10.1016/j.jda.2010.09.005 - 发表时间:
2011-03-01 - 期刊:
- 影响因子:
- 作者:
Raphaël Clifford;Benjamin Sach - 通讯作者:
Benjamin Sach
Sparse Suffix Tree Construction in Small Space
小空间稀疏后缀树构建
- DOI:
10.1007/978-3-642-39206-1_13 - 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Philip Bille;J. Fischer;Inge Li Gørtz;T. Kopelowitz;Benjamin Sach;Hjalte Wedel Vildhøj - 通讯作者:
Hjalte Wedel Vildhøj
Streaming Pattern Matching with Relabelling
流模式匹配与重新标记
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
R. Clifford;Markus Jalsenius;Benjamin Sach - 通讯作者:
Benjamin Sach
Sparse Su � x Tree Construction in Small Space
小空间稀疏子树构建
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Philip Bille;J. Fischer;Inge Li Gørtz;T. Kopelowitz;Benjamin Sach;Hjalte Wedel Vildhøj - 通讯作者:
Hjalte Wedel Vildhøj
Online Approximate Matching with Non-local Distances
与非局部距离的在线近似匹配
- DOI:
10.1007/978-3-642-02441-2_13 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
R. Clifford;Benjamin Sach - 通讯作者:
Benjamin Sach
Benjamin Sach的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Benjamin Sach', 18)}}的其他基金
Pattern matching algorithms for streaming data
流数据的模式匹配算法
- 批准号:
EP/H028056/1 - 财政年份:2011
- 资助金额:
$ 5.46万 - 项目类别:
Fellowship
相似国自然基金
超高速正则表达式匹配技术研究
- 批准号:61073184
- 批准年份:2010
- 资助金额:12.0 万元
- 项目类别:面上项目
相似海外基金
Comprehensive Evaluation of Algorithms for Indeterminate Pattern-Matching
不确定模式匹配算法的综合评价
- 批准号:
569128-2022 - 财政年份:2022
- 资助金额:
$ 5.46万 - 项目类别:
Postgraduate Scholarships - Doctoral
Development of optimal time-space algorithms on pattern matching problems
模式匹配问题的最优时空算法的发展
- 批准号:
19K20208 - 财政年份:2019
- 资助金额:
$ 5.46万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Dynamic pattern matching: Faster Algorithms and New Bounds
动态模式匹配:更快的算法和新界限
- 批准号:
EP/J011940/1 - 财政年份:2012
- 资助金额:
$ 5.46万 - 项目类别:
Research Grant
Fast parameterized pattern matching algorithms based on data compression
基于数据压缩的快速参数化模式匹配算法
- 批准号:
23700022 - 财政年份:2011
- 资助金额:
$ 5.46万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Pattern matching algorithms for streaming data
流数据的模式匹配算法
- 批准号:
EP/H028056/1 - 财政年份:2011
- 资助金额:
$ 5.46万 - 项目类别:
Fellowship
Design of fast tree pattern matching algorithms using bit-parallelism on strings
利用字符串位并行性的快速树模式匹配算法的设计
- 批准号:
21500010 - 财政年份:2009
- 资助金额:
$ 5.46万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Pattern matching algorithms for massive datasets
海量数据集的模式匹配算法
- 批准号:
EP/F02682X/1 - 财政年份:2008
- 资助金额:
$ 5.46万 - 项目类别:
Research Grant
Development of efficient machine discovery system based on data compression and pattern matching
基于数据压缩和模式匹配的高效机器发现系统的开发
- 批准号:
15300049 - 财政年份:2003
- 资助金额:
$ 5.46万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of Intelligent full text retrieval system based on data compression and fast string pattern matching algorithms
基于数据压缩和快速字符串模式匹配算法的智能全文检索系统开发
- 批准号:
13558029 - 财政年份:2001
- 资助金额:
$ 5.46万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of Intelligent Full-text Search System using Efficient Pattern Matching Algorithms on Compressed Data
利用压缩数据的高效模式匹配算法开发智能全文搜索系统
- 批准号:
10558047 - 财政年份:1998
- 资助金额:
$ 5.46万 - 项目类别:
Grant-in-Aid for Scientific Research (B).