Intruding into the midnight zone of protein comparisons

闯入蛋白质比较的午夜区域

基本信息

  • 批准号:
    6520482
  • 负责人:
  • 金额:
    $ 28.02万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2001
  • 资助国家:
    美国
  • 起止时间:
    2001-04-05 至 2005-03-31
  • 项目状态:
    已结题

项目摘要

Description (provided by applicant): The 'twilight zone' of protein sequence comparison is the region in which sequence similarity does not suffice to conclude e.g. structural similarity. The vast majority of all protein pairs of similar structure populate a 'midnight zone' i.e. their sequences differ too much for sequence-based comparisons. Here, we propose to refine, extend, and specialise methods combining sequence alignment, structure prediction and functional information. Goal is to unravel hidden similarities in entirely sequenced organisms by a reliable, automatic tool. Towards the end of our project, the sequences for most protein families realised by life will supposedly be available. We hope that our system will correctly detect a relation for most of these. (1) Prediction-based threading combines sequence alignments with predictions of secondary structure and accessibility to find remote similarities. We hope to considerably improve detection and alignment accuracy by comparing families with families rather than single proteins. (2) About one third of all proteins in worm and fly seem to have long regions lacking regular secondary structure. We hope to develop a method tailored to reliably detect and compare such regions. (3) No current method finds similarities between extremely diverged membrane proteins. We propose to develop such a method combining 'membrane threading' with classifications of membrane proteins. (4) Since sequence comparison in the twilight zone and below is an extremely demanding task, most existing methods have very low levels of accuracy. In practice, experts compare aspects of function between the protein pair under investigation. We want to develop an automatic method evaluating functional aspects. In particular, we intend to start with proteins binding to DNA. The tasks will be to (i) predict DNA-binding sites in proteins, and to (ii) restrict the threading to the subset of proteins for which binding regions were found. In the following step, we hope to use general sequence motifs for the automatic comparison. (5) Threading entire genomes: the first task will be to find all proteins in an entire organism for which we know structure. However, the particular edge of our method will be to find remote similarities even in the absence of experimental information about structure.
描述(由申请人提供):蛋白质序列的“模糊区” 比较是序列相似性不足以 例如,结构相似性。绝大多数的蛋白质对 类似的结构填充“午夜区”,即它们的序列也不同 对于基于序列的比较而言,在这里,我们建议完善,扩展, 结合序列比对、结构预测 功能信息。目标是揭开隐藏的相似之处, 通过可靠的自动工具对生物体进行测序。在我们的 项目中,生命所实现的大多数蛋白质家族的序列将 应该是可用的。我们希望我们的系统能够正确地检测到 对于其中的大多数关系。 (1)基于预测的线程化将序列比对与 二级结构和可访问性,以找到远程相似性。我们希望 通过比较系列,显著提高检测和比对精度 而不是单一的蛋白质。(2)大约三分之一的蛋白质 在蠕虫和苍蝇中似乎有长区域缺乏规则的二级结构。 我们希望开发出一种方法,能够可靠地检测和比较这种 地区(3)目前还没有一种方法能在极端分歧的 膜蛋白我们建议开发这样一种方法, 与膜蛋白的分类联系在一起。(4)自序列 在阴阳魔界及以下地区进行比较是一项极其艰巨的任务, 现有的方法具有非常低的精确度。在实践中,专家比较 研究中的蛋白质对之间的功能方面。我们想 开发一种自动评估功能方面的方法。我们尤其 从蛋白质与DNA结合开始。任务是:(一)预测 蛋白质中的DNA结合位点,以及(ii)将线程限制在子集 在接下来的步骤中,我们 希望使用通用序列模体进行自动比较。(5)螺纹 整个基因组:第一个任务将是找到整个基因组中的所有蛋白质。 我们所知道的结构。然而,我们的特殊优势 方法将是找到遥远的相似性,即使在没有实验的情况下, 关于结构的信息。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

BURKHARD ROST其他文献

BURKHARD ROST的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('BURKHARD ROST', 18)}}的其他基金

TU Muenchen Germany Project
慕尼黑工业大学德国项目
  • 批准号:
    8151857
  • 财政年份:
    2010
  • 资助金额:
    $ 28.02万
  • 项目类别:
Structural Genomics and Membrane Proteins
结构基因组学和膜蛋白
  • 批准号:
    8151996
  • 财政年份:
    2010
  • 资助金额:
    $ 28.02万
  • 项目类别:
Novel method to identify competing protein-protein binders
识别竞争性蛋白质-蛋白质结合物的新方法
  • 批准号:
    7362003
  • 财政年份:
    2009
  • 资助金额:
    $ 28.02万
  • 项目类别:
Comprehensive annotation of subcellular localization of entire organisms
整个生物体亚细胞定位的综合注释
  • 批准号:
    7342317
  • 财政年份:
    2007
  • 资助金额:
    $ 28.02万
  • 项目类别:
Comprehensive annotation of subcellular localization of entire organisms
整个生物体亚细胞定位的综合注释
  • 批准号:
    7681626
  • 财政年份:
    2007
  • 资助金额:
    $ 28.02万
  • 项目类别:
Comprehensive annotation of subcellular localization of entire organisms
整个生物体亚细胞定位的综合注释
  • 批准号:
    7500843
  • 财政年份:
    2007
  • 资助金额:
    $ 28.02万
  • 项目类别:
Comprehensive annotation of subcellular localization of entire organisms
整个生物体亚细胞定位的综合注释
  • 批准号:
    7924860
  • 财政年份:
    2007
  • 资助金额:
    $ 28.02万
  • 项目类别:
CORE--COMPUTATIONAL BIOLOGY /BIOMEDICAL INFORMATICS SCIE
核心--计算生物学/生物医学信息学 SCIE
  • 批准号:
    7050972
  • 财政年份:
    2005
  • 资助金额:
    $ 28.02万
  • 项目类别:
Sub 5 at Columbia
哥伦比亚 Sub 5
  • 批准号:
    7097638
  • 财政年份:
    2005
  • 资助金额:
    $ 28.02万
  • 项目类别:
CASP6-CASP8 meetings
CASP6-CASP8 会议
  • 批准号:
    6912668
  • 财政年份:
    2004
  • 资助金额:
    $ 28.02万
  • 项目类别:

相似海外基金

Automated data processing for two dimensional gas chromatography based metabolomics
基于二维气相色谱的代谢组学的自动数据处理
  • 批准号:
    495564
  • 财政年份:
    2023
  • 资助金额:
    $ 28.02万
  • 项目类别:
    Miscellaneous Programs
AUTOMATED DATA PROCESSING FOR GENOME SEQUENCING
基因组测序的自动化数据处理
  • 批准号:
    2889651
  • 财政年份:
    1992
  • 资助金额:
    $ 28.02万
  • 项目类别:
AUTOMATED DATA PROCESSING FOR GENOME SEQUENCING
基因组测序的自动化数据处理
  • 批准号:
    2026820
  • 财政年份:
    1992
  • 资助金额:
    $ 28.02万
  • 项目类别:
AUTOMATED DATA PROCESSING FOR GENOME SEQUENCING
基因组测序的自动化数据处理
  • 批准号:
    2674207
  • 财政年份:
    1992
  • 资助金额:
    $ 28.02万
  • 项目类别:
INFORMATION SYSTEMS BRANCH AUTOMATED DATA PROCESSING
信息系统分行自动化数据处理
  • 批准号:
    2316944
  • 财政年份:
    1989
  • 资助金额:
    $ 28.02万
  • 项目类别:
INFORMATION SYSTEMS BRANCH AUTOMATED DATA PROCESSING
信息系统分行自动化数据处理
  • 批准号:
    2316933
  • 财政年份:
    1989
  • 资助金额:
    $ 28.02万
  • 项目类别:
INFORMATION SYSTEMS BRANCH AUTOMATED DATA PROCESSING
信息系统分行自动化数据处理
  • 批准号:
    2316934
  • 财政年份:
    1989
  • 资助金额:
    $ 28.02万
  • 项目类别:
INFORMATION SYSTEMS BRANCH AUTOMATED DATA PROCESSING
信息系统分行自动化数据处理
  • 批准号:
    2316939
  • 财政年份:
    1989
  • 资助金额:
    $ 28.02万
  • 项目类别:
INFORMATION SYSTEMS BRANCH AUTOMATED DATA PROCESSING
信息系统分行自动化数据处理
  • 批准号:
    2316942
  • 财政年份:
    1989
  • 资助金额:
    $ 28.02万
  • 项目类别:
INFORMATION SYSTEMS BRANCH AUTOMATED DATA PROCESSING
信息系统分行自动化数据处理
  • 批准号:
    2316941
  • 财政年份:
    1989
  • 资助金额:
    $ 28.02万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了