Comparative Analysis Of Completely Sequenced Genomes

完全测序的基因组的比较分析

基本信息

  • 批准号:
    6988458
  • 负责人:
  • 金额:
    --
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
  • 资助国家:
    美国
  • 起止时间:
  • 项目状态:
    未结题

项目摘要

The rapidly growing database of completely sequenced genomes of bacteria, archaea and eukaryotes (approximately 200 genomes available by the end of 2004 and many more in progress) creates both new opportunities and new challenges for genome research. In order to take advantage of this information, we developed a system of Clusters of Orthologous Groups of proteins (COGs) from 30 completely sequenced genomes. This database is being continuously updated to incorporate newly appearing genomes. The COG approach allows nearly automatic functional annotation of 60-80% of the proteins encoded in each of the tested bacterial and archaeal genomes. During last year, the COG analysis was substantially expanded to include euakryotic genomes. Functional and evolutionary patterns in the recently constructed set of 5,873 clusters of predicted orthologs (eukaryotic orthologous groups or KOGs) from seven eukaryotic genomes: Caenorhabditis elegans, Drosophila melanogaster, Homo sapiens, Arabidopsis thaliana, Saccharomyces cerevisiae, Schizosaccharomyces pombe and Encephalitozoon cuniculi, were examined in detail. Conservation of KOGs through the phyletic range of eukaryotes strongly correlates with their functions and with the effect of gene knockout on the organism's viability. The approximately 40% of KOGs that are represented in six or seven species are enriched in proteins responsible for housekeeping functions, particularly translation and RNA processing. These conserved KOGs are often essential for survival and might approximate the minimal set of essential eukaryotic genes. The 131 single-member, pan-eukaryotic KOGs we identified were examined in detail. For around 20 that remained uncharacterized, functions were predicted by in-depth sequence analysis and examination of genomic context. Nearly all these proteins are subunits of known or predicted multiprotein complexes, in agreement with the balance hypothesis of evolution of gene copy number. Other KOGs show a variety of phyletic patterns, which points to major contributions of lineage-specific gene loss and the 'invention' of genes new to eukaryotic evolution. Examination of the sets of KOGs lost in individual lineages reveals co-elimination of functionally connected genes. Parsimonious scenarios of eukaryotic genome evolution and gene sets for ancestral eukaryotic forms were reconstructed. The gene set of the last common ancestor of the crown group consists of 3,413 KOGs and largely includes proteins involved in genome replication and expression, and central metabolism. Only 44% of the KOGs, mostly from the reconstructed gene set of the last common ancestor of the crown group, have detectable homologs in prokaryotes; the remainder apparently evolved via duplication with divergence and invention of new genes. CONCLUSIONS: The KOG analysis reveals a conserved core of largely essential eukaryotic genes as well as major diversification and innovation associated with evolution of eukaryotic genomes. The results provide quantitative support for major trends of eukaryotic evolution noticed previously at the qualitative level and a basis for detailed reconstruction of evolution of eukaryotic genomes and biology of ancestral forms.
细菌、古生物和真核生物全序列基因组数据库的迅速增长(到2004年底约有200个基因组可用,还有许多正在进行中)为基因组研究创造了新的机遇和新的挑战。为了利用这一信息,我们从30个完全测序的基因组中开发了一个由同源蛋白质组(COG)组成的系统。这个数据库正在不断更新,以纳入新出现的基因组。COG方法允许对每个测试的细菌和古菌基因组中编码的60%-80%的蛋白质进行几乎自动的功能注释。在去年,COG的分析大大扩展到包括真核细胞基因组。最近构建的一组5873个预测的同源物(真核同源组或KOG)的功能和进化模式被详细研究了,这些同源物来自七个真核基因组:秀丽线虫、黑腹果蝇、智人、拟南芥、酿酒酵母、庞氏裂殖酵母和楔脑虫。在真核生物的系统发育范围内,KOG的保守性与它们的功能以及基因敲除对生物体生存的影响密切相关。在6到7个物种中,大约40%的KOG富含负责家务功能的蛋白质,特别是翻译和RNA加工。这些保守的KOG通常是生存所必需的,可能接近最小的必需真核基因集。对我们鉴定的131个单成员、泛真核KOG进行了详细的研究。对于仍未确定特征的约20个,通过深入的序列分析和基因组环境的检查来预测功能。几乎所有这些蛋白质都是已知或预测的多蛋白复合体的亚基,这与基因拷贝数进化的平衡假说一致。其他的KOG显示了各种各样的系统模式,这表明了谱系特有的基因丢失和真核生物进化中新基因的“发明”的主要贡献。对个体谱系中丢失的KOG集合的检查显示,功能相关的基因共同消除。重建了真核生物基因组进化的简约场景和祖先真核生物形式的基因集。冠群最后一个共同祖先的基因集由3,413个KOG组成,主要包括参与基因组复制和表达以及中央代谢的蛋白质。只有44%的KOG在原核生物中有可检测到的同源物;其余的显然是通过复制和发散以及新基因的发明而进化的,这些KOG大多来自于冠群最后一个共同祖先的重建基因集。结论:KOG分析揭示了主要必需的真核基因的保守核心,以及与真核基因组进化相关的主要多样性和创新。这些结果为定性水平上观察到的真核生物进化的主要趋势提供了定量支持,并为详细重建真核生物基因组进化和祖先形式生物学奠定了基础。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Eugene V Koonin其他文献

The common ancestry of life
  • DOI:
    10.1186/1745-6150-5-64
  • 发表时间:
    2010-01-01
  • 期刊:
  • 影响因子:
    4.900
  • 作者:
    Eugene V Koonin;Yuri I Wolf
  • 通讯作者:
    Yuri I Wolf
Identification of dephospho-CoA kinase in Thermococcus kodakarensis and the complete CoA biosynthesis pathway
Thermococcus kodakarensis 中去磷酸 CoA 激酶的鉴定及完整 CoA 生物合成途径
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takahiro Shimosaka;Kira S Makarova;Eugene V Koonin;Haruyuki Atomi
  • 通讯作者:
    Haruyuki Atomi
Positive and strongly relaxed purifying selection drive the evolution of repeats in proteins
积极且强烈放松的纯化选择驱动蛋白质中重复序列的进化
  • DOI:
    10.1038/ncomms13570
  • 发表时间:
    2016-11-18
  • 期刊:
  • 影响因子:
    15.700
  • 作者:
    Erez Persi;Yuri I. Wolf;Eugene V Koonin
  • 通讯作者:
    Eugene V Koonin
Evolutionary primacy of sodium bioenergetics
  • DOI:
    10.1186/1745-6150-3-13
  • 发表时间:
    2008-04-01
  • 期刊:
  • 影响因子:
    4.900
  • 作者:
    Armen Y Mulkidjanian;Michael Y Galperin;Kira S Makarova;Yuri I Wolf;Eugene V Koonin
  • 通讯作者:
    Eugene V Koonin
Classification and evolutionary history of the single-strand annealing proteins, RecT, Redβ, ERF and RAD52
  • DOI:
    10.1186/1471-2164-3-8
  • 发表时间:
    2002-03-21
  • 期刊:
  • 影响因子:
    3.700
  • 作者:
    Lakshminarayan M Iyer;Eugene V Koonin;L Aravind
  • 通讯作者:
    L Aravind

Eugene V Koonin的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Eugene V Koonin', 18)}}的其他基金

Finding Protein Sequence Motifs--Methods and Application
寻找蛋白质序列基序--方法与应用
  • 批准号:
    6988455
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Finding Protein Sequence Motifs--methods And Application
寻找蛋白质序列基序--方法与应用
  • 批准号:
    6681337
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Comparative Analysis Of Completely Sequenced Genomes
完全测序的基因组的比较分析
  • 批准号:
    7969213
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Finding Protein Sequence Motifs--methods And Applications
寻找蛋白质序列基序——方法和应用
  • 批准号:
    8943217
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Comparative Analysis Of Completely Sequenced Genomes
完全测序的基因组的比较分析
  • 批准号:
    9160910
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Finding Protein Sequence Motifs--methods And Applications
寻找蛋白质序列基序——方法和应用
  • 批准号:
    9555730
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Finding Protein Sequence Motifs--methods And Applications
寻找蛋白质序列基序——方法和应用
  • 批准号:
    7594460
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Finding Protein Sequence Motifs--methods And Applications
寻找蛋白质序列基序——方法和应用
  • 批准号:
    7735068
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
COMPARATIVE ANALYSIS OF COMPLETELY SEQUENCED GENOMES
全测序基因组的比较分析
  • 批准号:
    6111075
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:
Comparative Analysis Of Completely Sequenced Genomes
完全测序的基因组的比较分析
  • 批准号:
    7316251
  • 财政年份:
  • 资助金额:
    --
  • 项目类别:

相似国自然基金

Segmented Filamentous Bacteria激活宿主免疫系统抑制其拮抗菌 Enterobacteriaceae维持菌群平衡及其机制研究
  • 批准号:
    81971557
  • 批准年份:
    2019
  • 资助金额:
    65.0 万元
  • 项目类别:
    面上项目
电缆细菌(Cable bacteria)对水体沉积物有机污染的响应与调控机制
  • 批准号:
    51678163
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
溶藻细菌及其胞外活性物质对球形棕囊藻的溶藻机制
  • 批准号:
    41076068
  • 批准年份:
    2010
  • 资助金额:
    45.0 万元
  • 项目类别:
    面上项目
不同栽培环境条件下不同基因型牡丹根部细菌种群多样性特征
  • 批准号:
    31070617
  • 批准年份:
    2010
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目
水稻种子际固有细菌的群落多样性及其瞬时演替研究
  • 批准号:
    30770069
  • 批准年份:
    2007
  • 资助金额:
    30.0 万元
  • 项目类别:
    面上项目
应用非培养(Culture-independent)方法研究水稻植物内生细菌种群多样性及其与宿主的和谐联合
  • 批准号:
    30370032
  • 批准年份:
    2003
  • 资助金额:
    20.0 万元
  • 项目类别:
    面上项目

相似海外基金

Did light dictate ancient diversification of phylogeny and cell structure in the domain bacteria?
光是否决定了细菌领域的古代系统发育和细胞结构的多样化?
  • 批准号:
    24H00582
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Cell Wall Formation in Rod Shaped Bacteria
杆状细菌细胞壁的形成
  • 批准号:
    BB/Y003187/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
Role of intestinal serotonin transporter in post traumatic stress disorder
肠道血清素转运蛋白在创伤后应激障碍中的作用
  • 批准号:
    10590033
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
Conference: Symposium on the Immune System of Bacteria
会议:细菌免疫系统研讨会
  • 批准号:
    2349218
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
DNA replication dynamics in living bacteria
活细菌中的 DNA 复制动态
  • 批准号:
    23K25843
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
DYNBIOTICS - Understanding the dynamics of antibiotics transport in individual bacteria
DYNBIOTICS - 了解抗生素在单个细菌中转运的动态
  • 批准号:
    EP/Y023528/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
NPBactID - Differential binding of peptoid functionalized nanoparticles to bacteria for identifying specific strains
NPBactID - 类肽功能化纳米粒子与细菌的差异结合,用于识别特定菌株
  • 批准号:
    EP/Y029542/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Fellowship
Assembly of the matrix that supports bacteria living in biofilms
支持生活在生物膜中的细菌的基质的组装
  • 批准号:
    2468773
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Studentship
Cell wall dynamics in Gram-positive bacteria
革兰氏阳性细菌的细胞壁动力学
  • 批准号:
    502580
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
BacNLR - Functional diversity of NLRs in multicellular bacteria
BacNLR - 多细胞细菌中 NLR 的功能多样性
  • 批准号:
    EP/Z000092/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了