USE THE EDIT DISTANCE IN THE ND-TREE FOR EFFICIENT BIOINFORMATICS QUERIES

使用 ND 树中的编辑距离进行高效的生物信息学查询

基本信息

  • 批准号:
    7725103
  • 负责人:
  • 金额:
    $ 2.64万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2008
  • 资助国家:
    美国
  • 起止时间:
    2008-05-01 至 2009-04-30
  • 项目状态:
    已结题

项目摘要

This subproject is one of many research subprojects utilizing the resources provided by a Center grant funded by NIH/NCRR. The subproject and investigator (PI) may have received primary funding from another NIH source, and thus could be represented in other CRISP entries. The institution listed is for the Center, which is not necessarily the institution for the investigator. As the volume of biological data increases rapidly, index-based approaches to searching the data becomes more favorable than sequential-scan-based approaches. This subproject investigates the application of the ND-tree, a multidimensional structure specifically designed to index substrings/q-grams with discrete and non-ordered components typical of bioinformatics data, to bioinformatics queries. The aim of this subproject is to extend the ND-tree to support the edit distance, a widely-used similarity measure for homologous region queries. The goal of the extension is to enhance the sensitivity in the filtering stage of a bioinformatics database query. To incorporate the edit distance which employs the extra insertion and deletion operations than the Hamming distance, the ND-tree must support efficient similarity queries with a relatively large search range. In the first phase of this project, we will design and evaluate novel algorithms that efficiently process queries with relatively large search ranges in the ND-tree. We plan to investigate approximation-based techniques that can improve query performance by pruning a large amount of less-promising index branches. In the second phase, a query algorithm based on the edit distance will be developed. To further enhance the performance, the construction and bulk-loading algorithms of the ND-tree will also be examined and adapted so that the data organization within the index becomes more suitable for edit distance queries. To evaluate the effectiveness of the new algorithms, we will experimentally compare them with existing algorithms. The project will lead to the design of a novel bioinformatics search engine based on the ND-tree.
这个子项目是许多研究子项目中的一个 由NIH/NCRR资助的中心赠款提供的资源。子项目和 研究者(PI)可能从另一个NIH来源获得了主要资金, 因此可以在其他CRISP条目中表示。所列机构为 研究中心,而研究中心不一定是研究者所在的机构。 随着生物数据量的快速增长,基于索引的数据搜索方法变得比基于顺序扫描的方法更有利。该子项目研究了ND树的应用,ND树是一种多维结构,专门用于索引具有生物信息学数据典型的离散和无序组件的子串/q-gram,用于生物信息学查询。 这个子项目的目的是扩展ND树,以支持编辑距离,一个广泛使用的相似性度量同源区域查询。 该扩展的目标是提高生物信息学数据库查询过滤阶段的灵敏度。 为了结合编辑距离,它采用额外的插入和删除操作比汉明距离,ND树必须支持有效的相似性查询具有相对较大的搜索范围。在这个项目的第一阶段,我们将设计和评估新的算法,有效地处理查询ND树中相对较大的搜索范围。 我们计划研究基于近似的技术,可以通过修剪大量不太有前途的索引分支来提高查询性能。 在第二阶段,将开发基于编辑距离的查询算法。 为了进一步提高性能,ND树的构造和批量加载算法也将被检查和调整,以便索引中的数据组织变得更适合于编辑距离查询。 为了评估新算法的有效性,我们将实验比较它们与现有的算法。 该项目将导致一个新的生物信息学搜索引擎的设计基于ND树。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

GANG QIAN其他文献

GANG QIAN的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('GANG QIAN', 18)}}的其他基金

SUBSTITUTION MATRICES INTO THE NSP-TREE IN BIOLOGICAL SEQUENCE DATABASES
生物序列数据库中 NSP 树的替换矩阵
  • 批准号:
    8167540
  • 财政年份:
    2010
  • 资助金额:
    $ 2.64万
  • 项目类别:
USE THE EDIT DISTANCE IN THE ND-TREE FOR EFFICIENT BIOINFORMATICS QUERIES
使用 ND 树中的编辑距离进行高效的生物信息学查询
  • 批准号:
    7960025
  • 财政年份:
    2009
  • 资助金额:
    $ 2.64万
  • 项目类别:
BULK-LOADING & PERFORMANCE STUDIES OF THE ND-TREE FOR LARGE GENOME DATABASES
散装
  • 批准号:
    7610287
  • 财政年份:
    2007
  • 资助金额:
    $ 2.64万
  • 项目类别:

相似海外基金

Collaborative Research: IIBR: Innovation: Bioinformatics: Linking Chemical and Biological Space: Deep Learning and Experimentation for Property-Controlled Molecule Generation
合作研究:IIBR:创新:生物信息学:连接化学和生物空间:属性控制分子生成的深度学习和实验
  • 批准号:
    2318829
  • 财政年份:
    2023
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Continuing Grant
Analysis of biological small molecule mixtures using multiple modes of mass spectrometric fragmentation coupled with new bioinformatics workflows
使用多种质谱裂解模式结合新的生物信息学工作流程分析生物小分子混合物
  • 批准号:
    BB/X019802/1
  • 财政年份:
    2023
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Research Grant
Collaborative Research: IIBR: Innovation: Bioinformatics: Linking Chemical and Biological Space: Deep Learning and Experimentation for Property-Controlled Molecule Generation
合作研究:IIBR:创新:生物信息学:连接化学和生物空间:属性控制分子生成的深度学习和实验
  • 批准号:
    2318830
  • 财政年份:
    2023
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Continuing Grant
Collaborative Research: IIBR: Innovation: Bioinformatics: Linking Chemical and Biological Space: Deep Learning and Experimentation for Property-Controlled Molecule Generation
合作研究:IIBR:创新:生物信息学:连接化学和生物空间:属性控制分子生成的深度学习和实验
  • 批准号:
    2318831
  • 财政年份:
    2023
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Continuing Grant
Bioinformatics-powered genetic characterization of the impact of biological systems on Alzheimer's disease and neurodegeneration
基于生物信息学的生物系统对阿尔茨海默病和神经退行性疾病影响的遗传表征
  • 批准号:
    484699
  • 财政年份:
    2022
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Operating Grants
REU Site: Bioinformatics Research and Interdisciplinary Training Experience in Analysis and Interpretation of Information-Rich Biological Data Sets (REU-BRITE)
REU网站:信息丰富的生物数据集分析和解释的生物信息学研究和跨学科培训经验(REU-BRITE)
  • 批准号:
    1949968
  • 财政年份:
    2020
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Standard Grant
REU Site: Bioinformatics Research and Interdisciplinary Training Experience in Analysis and Interpretation of Information-Rich Biological Data Sets (REU-BRITE)
REU网站:信息丰富的生物数据集分析和解释的生物信息学研究和跨学科培训经验(REU-BRITE)
  • 批准号:
    1559829
  • 财政年份:
    2016
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Continuing Grant
Bioinformatics Tools to Design and Optimize Biological Sensor Systems
用于设计和优化生物传感器系统的生物信息学工具
  • 批准号:
    416848-2011
  • 财政年份:
    2011
  • 资助金额:
    $ 2.64万
  • 项目类别:
    University Undergraduate Student Research Awards
ABI Development: bioKepler: A Comprehensive Bioinformatics Scientific Workflow Module for Distributed Analysis of Large-Scale Biological Data
ABI 开发:bioKepler:用于大规模生物数据分布式分析的综合生物信息学科学工作流程模块
  • 批准号:
    1062565
  • 财政年份:
    2011
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Continuing Grant
Bioinformatics-based hypothesis generation with biological validation for plant stress biology
基于生物信息学的假设生成和植物逆境生物学的生物验证
  • 批准号:
    261818-2006
  • 财政年份:
    2010
  • 资助金额:
    $ 2.64万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了