CAREER: De novo assembly of duplicated sequences in vertebrate genomes

职业:脊椎动物基因组中重复序列的从头组装

基本信息

  • 批准号:
    2046753
  • 负责人:
  • 金额:
    $ 59.74万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2021
  • 资助国家:
    美国
  • 起止时间:
    2021-08-01 至 2026-07-31
  • 项目状态:
    未结题

项目摘要

Many genomes contain long, low-copy repeated sequences called segmental duplications. These arise as a result of mistakes of genome replication, and when they overlap genes or other functional DNA can have an effect on fitness of an organism and evolution of a species. Duplicated sequences have been historically difficult to study. Sequencing instruments can only read short fragments of DNA, and entire genomes must be reconstructed based on how the DNA fragments overlap, much like assembling a jigsaw puzzle. Repeated sequences longer than the length of fragment that an instrument can read cannot correctly be included in an assembly. Improvements in sequencing technology that have increased the length of fragments that may be read and algorithms for assembling genomes have enabled increased resolution of repeats, creating an opportunity to study segmental duplication in diverse species. The aim of this project is to develop computational tools to study segmental duplications in nonhuman genomes, first through constructing methods to catalog duplicated genes in multiple genomes, and next to improve methods for assembling duplicated sequences. This can help improve our understanding of how genomes have evolved through duplication, and shed light on what genes have played a role in adaptation. This project also supports the creation of a USC Summer Genome Program, where undergraduate students from the greater Southern California area participate to sequence, annotate, and publish on a genome in preparation for continuing to an advanced postgraduate degree.The initial focus of the project is to develop a method to curate duplicated genes in vertebrate genomes. This will be accomplished using a computational pipeline to detect duplicated genes that have been resolved in multiple copies in an assembly as well as identify genes that have missing copies. Genes that have missing copies are identified through excess coverage of reads mapped back to the assembly. When the missing copies of genes have paralog-specific variants, additional copies of the duplicated gene may be resolved using a more sensitive approach to assembly. A method that was previously developed to resolve missing genes that contain paralog-specific variants, SDA, will be improved to operate on new data types and address more complex duplication organizations. Finally, a combination of duplication resolution and curation will be applied to quantify gene duplication across over 100 genomes sequenced by the Vertebrate Genome Project. The results of this project will be listed under publications and resources at chaissonlab.usc.edu.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
许多基因组包含长的、低拷贝的重复序列,称为片段重复。这些是由于基因组复制错误而产生的,当它们与基因或其他功能DNA重叠时,会对生物体的适应性和物种的进化产生影响。重复序列历来难以研究。测序仪器只能读取DNA的短片段,整个基因组必须根据DNA片段的重叠方式进行重建,就像组装拼图一样。超过仪器可读取的片段长度的重复序列不能正确地包含在组装体中。测序技术的改进增加了可读取片段的长度,组装基因组的算法也提高了重复序列的分辨率,为研究不同物种的片段重复创造了机会。该项目的目的是开发计算工具来研究非人类基因组中的片段重复,首先通过构建方法来编目多个基因组中的重复基因,然后改进组装重复序列的方法。这可以帮助我们更好地理解基因组是如何通过复制进化的,并阐明哪些基因在适应中发挥了作用。该项目还支持南加州大学夏季基因组计划的创建,来自南加州地区的本科生参与基因组测序、注释和发表,为继续攻读高级研究生学位做准备。该项目的最初重点是开发一种方法来管理脊椎动物基因组中的重复基因。这将通过使用计算管道来检测在组装中以多个拷贝解析的重复基因以及识别具有缺失拷贝的基因来实现。具有缺失拷贝的基因通过映射回组装的读段的过量覆盖来鉴定。当缺失的基因拷贝具有旁系同源特异性变体时,可以使用更灵敏的组装方法来解析重复基因的额外拷贝。之前开发的用于解决包含旁系同源特异性变体的缺失基因的方法SDA将得到改进,以操作新的数据类型并解决更复杂的重复组织。最后,重复解析和策展的组合将被应用于量化脊椎动物基因组计划测序的100多个基因组中的基因重复。该项目的成果将在chaissonlab.usc.edu的出版物和资源下列出。该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的知识价值和更广泛的影响审查标准进行评估来支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mark Chaisson其他文献

Mark Chaisson的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

DNMT3B通过de novo甲基化下调EIF4A3表达抑制PI3K/AKT通路减少巨噬细胞M2极化增强NPC放疗抵抗的研究
  • 批准号:
    2025JJ70151
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
BAIAP2基因de novo变异在儿童发育性癫痫性脑病中的作用 及机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
基于中国马Y染色体de novo组装对家马父系起源进化及繁殖性状候选基因定位的研究
  • 批准号:
    32302731
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于Cre酶的靶向性de novo DNA甲基化技术和模型开发
  • 批准号:
    32300469
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
狼疮易感基因PHRF1及其de novo突变R194C的免疫病理机制研究
  • 批准号:
    32270946
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
IDO-1介导的De novo NAD+合成激活在肺动脉高压中的作用和机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
转录抑制辅因子de novo突变在系统性红斑狼疮中的发病机制研究
  • 批准号:
    32170903
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
水稻de novo基因OsJDG1调控籼粳粒型分化的机理研究
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    58 万元
  • 项目类别:
    面上项目
致聋基因de novo突变遗传来源及传递方式研究
  • 批准号:
    81900951
  • 批准年份:
    2019
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
牦牛Y染色体雄性特异区的de novo组装及SNP图谱构建
  • 批准号:
    31960656
  • 批准年份:
    2019
  • 资助金额:
    40.0 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

de novo 脂肪酸合成経路に着目した心臓線維化の分子機序解明と治療法の確立
阐明心脏纤维化的分子机制并建立以脂肪酸从头合成途径为重点的治疗方法
  • 批准号:
    24K11290
  • 财政年份:
    2024
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
次世代mRNAに資するde novo IRESの創製
从头创建 IRES 有助于下一代 mRNA
  • 批准号:
    24KJ1491
  • 财政年份:
    2024
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
三次元血管モデルを用いた弾性線維のde novo形成機構の解明と再生法の開発
利用三维血管模型阐明弹性纤维的从头形成机制并开发再生方法
  • 批准号:
    23K18320
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
成体の血管恒常性維持におけるペリサイトのde novo発生機構の解明
阐明周细胞维持成人血管稳态的从头生成机制
  • 批准号:
    23KJ1987
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
中心小体de novo形成を介したがん抑制機構の解明
阐明中心粒从头形成介导的癌症抑制机制
  • 批准号:
    23KJ0800
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Inherited and de novo genetic variants relevant to familial, recurrent and sporadic stillbirth
与家族性、复发性和散发性死产相关的遗传性和从头遗传变异
  • 批准号:
    10719376
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
Development of Next-Generation Mass Spectrometry-based de novo RNA Sequencing for all Modifications
开发适用于所有修饰的下一代基于质谱的从头 RNA 测序
  • 批准号:
    10581994
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
Conference: SMBE Satellite Meeting On De Novo Gene Birth
会议:SMBE 关于 De Novo 基因诞生的卫星会议
  • 批准号:
    2305321
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: De Novo Protein Scaffold Filling by Combinatorial Algorithms and Deep Learning Models
合作研究:FET:小型:通过组合算法和深度学习模型从头填充蛋白质支架
  • 批准号:
    2307573
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Standard Grant
Collaborative Research: DMREF: De Novo Proteins as Junctions in Polymer Networks
合作研究:DMREF:De Novo 蛋白质作为聚合物网络中的连接点
  • 批准号:
    2323315
  • 财政年份:
    2023
  • 资助金额:
    $ 59.74万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了