Pattern Discovery in Combinatorial Databases: Algorithms, Applications, and Software for the Scientific Community

组合数据库中的模式发现:科学界的算法、应用程序和软件

基本信息

  • 批准号:
    9531554
  • 负责人:
  • 金额:
    $ 42.29万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    1996
  • 资助国家:
    美国
  • 起止时间:
    1996-08-01 至 2000-07-31
  • 项目状态:
    已结题

项目摘要

This is an interinstitutional collaborative project. Combinatorial data consisting of sequences, trees, and graphs arise in many scientific disciplines. For example, the primary structure of proteins is a sequence, whereas the tertiary structure is a graph. Comparing such data to find similarities entails the use of a "distance metric" that mea sures the difference between two data items. Numerous distance metrics are possible. This work consists primarily of (i) inventing efficient ways to compute known distance metrics; (ii) developing a data structure to decide which of a set of data items is "closest" (according to a given distance metric) to a new data item; (iii) techniques and s oftware for discovering patterns with minimum or near-minimum distance to a given set of data items with respect to a given distance metric; and (iv) software to solve such discovery problems on networks of occasionally idle workstations. This work will help every field in which approximate matching is important. Significant applications are expe cted to molecular biology and rational drug design, as well as to finding patterns in linguistic strings.
这是一个机构间合作项目。 由序列、树和图组成的组合数据出现在许多科学学科中。 例如,蛋白质的一级结构是序列,而三级结构是图。 比较这些数据以找到相似之处需要使用“距离度量”来测量两个数据项之间的差异。 许多距离度量是可能的。 这项工作主要包括(i)发明有效的方法来计算已知的距离度量;(ii)开发一种数据结构来决定一组数据项中的哪一个是“最近的”(iii)用于发现相对于给定距离度量具有到给定数据项集合的最小或接近最小距离的模式的技术和软件;以及(iv)解决偶尔空闲工作站的网络上的这种发现问题的软件。 这项工作将有助于近似匹配重要的每个领域。它在分子生物学、合理药物设计以及在语言字符串中寻找模式等方面有着重要的应用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Dennis Shasha其他文献

Revelation on demand
  • DOI:
    10.1007/s10619-009-7035-x
  • 发表时间:
    2009-02-27
  • 期刊:
  • 影响因子:
    0.900
  • 作者:
    Nicolas Anciaux;Mehdi Benzine;Luc Bouganim;Philippe Pucheral;Dennis Shasha
  • 通讯作者:
    Dennis Shasha
Sungear: interactive visualization and functional analysis of genomic datasets
Sungear:基因组数据集的交互式可视化和功能分析
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Christopher S. Poultney;Rodrigo A. Gutiérrez;M. Katari;Miriam L. Gifford;W. Bradford Paley;G. Coruzzi;Dennis Shasha
  • 通讯作者:
    Dennis Shasha
Hi-C Allows Genome-Wide Characterization of Enhancer-Driven Oncogene Rearrangements in Formalin-Fixed Lymphoid Cancer Biopsies
  • DOI:
    10.1182/blood-2024-201614
  • 发表时间:
    2024-11-05
  • 期刊:
  • 影响因子:
  • 作者:
    Jamin Wu;Alec Chu;Jang Cho;Misha Movahed-Ezazi;Kristyn Galbraith;Chanel Schroff;Yiying Yang;Jon-Matthew Belton;Valentina Nardi;Abner Louissaint;Dennis Shasha;Tatyana Gindin;Minji Kim;Marcin P Cieslik;Anthony Schmitt;Matija Snuderl;Russell J. H. Ryan
  • 通讯作者:
    Russell J. H. Ryan
PLinda User Manual
普琳达用户手册
  • DOI:
  • 发表时间:
    1996
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Brown;K. Jeong;Bin Li;S. Talla;Peter Wyckoo;Dennis Shasha
  • 通讯作者:
    Dennis Shasha
Correction to: BugDoc Iterative debugging and explanation of pipeline executions
  • DOI:
    10.1007/s00778-022-00751-3
  • 发表时间:
    2022-06-13
  • 期刊:
  • 影响因子:
    3.800
  • 作者:
    Raoni Lourenço;Juliana Freire;Eric Simon;Gabriel Weber;Dennis Shasha
  • 通讯作者:
    Dennis Shasha

Dennis Shasha的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Dennis Shasha', 18)}}的其他基金

III: EAGER: Collaborative Research: A Community Experiment Platform for Reproducibility and Generalizability
III:EAGER:协作研究:可重复性和普遍性的社区实验平台
  • 批准号:
    1050388
  • 财政年份:
    2010
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Standard Grant
Primitives for Online Time Series Analysis
在线时间序列分析的基元
  • 批准号:
    0414763
  • 财政年份:
    2005
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Standard Grant
Collaborative Research: ASES: An Approximate Search Engine for Structure
合作研究:ASES:结构近似搜索引擎
  • 批准号:
    9988345
  • 财政年份:
    2000
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Continuing Grant
Discovering Motifs in Scientific Databases
发现科学数据库中的主题
  • 批准号:
    9224601
  • 财政年份:
    1993
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Continuing Grant
Performance of Concurrent Data Algorithms
并发数据算法的性能
  • 批准号:
    8901699
  • 财政年份:
    1989
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Continuing Grant
Research on Semantically-Based Concurrency Control for Dqta Structures
基于语义的Dqta结构并发控制研究
  • 批准号:
    8501611
  • 财政年份:
    1985
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Continuing Grant

相似海外基金

Combinatorial algorithms for pattern discovery in RNA sequences
RNA 序列模式发现的组合算法
  • 批准号:
    250909-2006
  • 财政年份:
    2010
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
Combinatorial algorithms for pattern discovery in RNA sequences
RNA 序列模式发现的组合算法
  • 批准号:
    250909-2006
  • 财政年份:
    2009
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
Combinatorial algorithms for pattern discovery in RNA sequences
RNA 序列模式发现的组合算法
  • 批准号:
    250909-2006
  • 财政年份:
    2008
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
Combinatorial algorithms for pattern discovery in RNA sequences
RNA 序列模式发现的组合算法
  • 批准号:
    250909-2006
  • 财政年份:
    2007
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
Combinatorial algorithms for pattern discovery in RNA sequences
RNA 序列模式发现的组合算法
  • 批准号:
    250909-2006
  • 财政年份:
    2006
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
CAREER: Combinatorial Algorithms for Pattern Discovery with Applications to Data Mining and Computational Biology
职业:模式发现的组合算法及其在数据挖掘和计算生物学中的应用
  • 批准号:
    0447773
  • 财政年份:
    2005
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Continuing Grant
Issues in combinatorial pattern matching and discovery
组合模式匹配和发现中的问题
  • 批准号:
    46373-1999
  • 财政年份:
    2002
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
Issues in combinatorial pattern matching and discovery
组合模式匹配和发现中的问题
  • 批准号:
    46373-1999
  • 财政年份:
    2001
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
Issues in combinatorial pattern matching and discovery
组合模式匹配和发现中的问题
  • 批准号:
    46373-1999
  • 财政年份:
    2000
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
Issues in combinatorial pattern matching and discovery
组合模式匹配和发现中的问题
  • 批准号:
    46373-1999
  • 财政年份:
    1999
  • 资助金额:
    $ 42.29万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了