III: Small: Algorithms for Genome Assembly of Ultra-Deep Sequencing Data
III:小:超深度测序数据的基因组组装算法
基本信息
- 批准号:1526742
- 负责人:
- 金额:$ 49.9万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-08-01 至 2019-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project will investigate the computational challenges that will brought upon by the analysis of ultra-deep sequencing data (i.e., coverage 1000x or higher), specifically in the context of de novo genome assembly. As sequencing cost continues to decrease, ultra-deep sequencing data will become more common, but the problem of de novo genome assembly remains computationally challenging, in particular for large, repetitive genomes. Since the sequencing of H. influenzae in 1995, the assembly problem has been characterized by limited depth of sequencing coverage mostly due to the high cost of generating the data. This project will investigate for the first time the opposite problem, that is, the challenge of dealing with excessive depth of sequencing. Deliverables will include novel software tools for genome assembly which will benefit researchers and the public worldwide, and potentially lead to new international and industrial collaborations. This project will directly support two graduate students in a highly interdisciplinary environment, building on UCR's strengths in Computer Science and Agricultural Sciences. Undergraduates will have opportunities to participate in research through a Research Experiences for Undergraduates (REU) site at UCR, a collaboration with a nearby community college, and a new US Department of Education Title V Hispanic Serving Institution grant (UCR is an accredited HSI).The research plan is aimed at de novo assembly problem under the assumption that the input sequencing data is ultra-deep. The study will demonstrate that when the depth of sequencing increases over a certain threshold, sequencing errors make the genome assembly problem harder and harder, and as a consequence the quality of the solution degrades with more and more data. The project will show that modern de novo assemblers like SPAdes, IDBA-ud, and Velvet are unable take advantage of ultra-deep sequencing data. The research plan will deal with ultra-deep sequencing data using a divide-and-conquer approach. In this proposed meta-assembler, the input data will be partitioned into optimal-sized "slices" and a standard assembly tool (e.g., Velvet, SPAdes, IDBA, Ray) will be used to assemble each slice individually. For the de novo assembler, a set of de Bruijn graphs will be created, each one built form the sequencing data of a slice. In both cases, a majority voting strategy among the individual assemblies/graphs will be used to generate a high-quality consensus assembly.Updates and additional information about this project will be made available at http://www.cs.ucr.edu/~stelo/iis15.htm
该项目将研究超深度测序数据分析带来的计算挑战(即,覆盖率1000 x或更高),特别是在从头基因组组装的情况下。随着测序成本的持续降低,超深度测序数据将变得更加普遍,但从头基因组组装的问题仍然具有计算挑战性,特别是对于大型重复基因组。 由于H.在1995年的流感病毒中,组装问题的特征在于有限的测序覆盖深度,这主要是由于产生数据的高成本。 该项目将首次调查相反的问题,即处理过度测序深度的挑战。 可移植物将包括用于基因组组装的新型软件工具,这将使全世界的研究人员和公众受益,并可能导致新的国际和工业合作。该项目将直接支持两名研究生在一个高度跨学科的环境,建立在计算机科学和农业科学的UCR的优势。本科生将有机会通过UCR的本科生研究经验(REU)网站参与研究,与附近的社区学院合作,以及新的美国教育部Title V西班牙裔服务机构补助金(UCR是一个认可的HSI)。该研究计划旨在假设输入测序数据是超深的从头组装问题。该研究将证明,当测序的深度超过一定阈值时,测序错误会使基因组组装问题变得越来越困难,因此解决方案的质量会随着越来越多的数据而下降。该项目将表明,SPAdes、IDBA-ud和Velvet等现代从头组装程序无法利用超深度测序数据。该研究计划将使用分而治之的方法处理超深度测序数据。在这个提出的元汇编器中,输入数据将被划分为最佳大小的“切片”和标准汇编工具(例如,Velvet、SPAdes、IDBA、Ray)将用于单独组装每个切片。对于从头组装器,将创建一组de Bruijn图,每个图都是从切片的测序数据构建的。 在这两种情况下,将使用单个程序集/图之间的多数投票策略来生成高质量的共识程序集。有关此项目的更新和其他信息,请访问http://www.cs.ucr.edu/~stelo/iis15.htm
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Accurate detection of chimeric contigs via Bionano optical maps
- DOI:10.1093/bioinformatics/bty850
- 发表时间:2019-05-15
- 期刊:
- 影响因子:5.8
- 作者:Pan, Weihua;Lonardi, Stefano
- 通讯作者:Lonardi, Stefano
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Stefano Lonardi其他文献
TRFill: synergistic use of HiFi and Hi-C sequencing enables accurate assembly of tandem repeats for population-level analysis
- DOI:
10.1186/s13059-025-03685-5 - 发表时间:
2025-07-28 - 期刊:
- 影响因子:9.400
- 作者:
Huaming Wen;Jinbao Yang;Xianjia Zhao;Xingbin Wang;Jiawei Lei;Yanchun Li;Wenjie Du;Dongxi Li;Yun Xu;Stefano Lonardi;Weihua Pan - 通讯作者:
Weihua Pan
Correction to: Comprehensive benchmarking and ensemble approaches for metagenomic classifiers
- DOI:
10.1186/s13059-019-1687-2 - 发表时间:
2019-04-05 - 期刊:
- 影响因子:9.400
- 作者:
Alexa B. R. McIntyre;Rachid Ounit;Ebrahim Afshinnekoo;Robert J. Prill;Elizabeth Hénaff;Noah Alexander;Samuel S. Minot;David Danko;Jonathan Foox;Sofia Ahsanuddin;Scott Tighe;Nur A. Hasan;Poorani Subramanian;Kelly Moffat;Shawn Levy;Stefano Lonardi;Nick Greenfield;Rita R. Colwell;Gail L. Rosen;Christopher E. Mason - 通讯作者:
Christopher E. Mason
Stefano Lonardi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Stefano Lonardi', 18)}}的其他基金
III: Small: Improving de novo Genome Assembly using Optical Maps
III:小:使用光学图谱改进从头基因组组装
- 批准号:
1814359 - 财政年份:2018
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
III: Medium: Algorithms and Software Tools for Epigenetics Research
III:媒介:表观遗传学研究的算法和软件工具
- 批准号:
1302134 - 财政年份:2013
- 资助金额:
$ 49.9万 - 项目类别:
Continuing Grant
ABI Innovation: Barcoding-Free Multiplexing: Leveraging Combinatorial Pooling for High-Throughput Sequencing
ABI 创新:无条形码多重分析:利用组合池进行高通量测序
- 批准号:
1062301 - 财政年份:2011
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
CAREER: Combinatorial Algorithms for Pattern Discovery with Applications to Data Mining and Computational Biology
职业:模式发现的组合算法及其在数据挖掘和计算生物学中的应用
- 批准号:
0447773 - 财政年份:2005
- 资助金额:
$ 49.9万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
III: Small: Stochastic Algorithms for Large Scale Data Analysis
III:小型:大规模数据分析的随机算法
- 批准号:
2131335 - 财政年份:2021
- 资助金额:
$ 49.9万 - 项目类别:
Continuing Grant
III: Small: Collaborative Research: Algorithms, systems, and theories for exploiting data dependencies in crowdsourcing
III:小型:协作研究:在众包中利用数据依赖性的算法、系统和理论
- 批准号:
2007941 - 财政年份:2020
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
III: Small: Combinatorial Algorithms for High-dimensional Learning
III:小:高维学习的组合算法
- 批准号:
2008557 - 财政年份:2020
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
III: Small: Towards the Foundations of Training Deep Neural Networks: New Theory and Algorithms
III:小:迈向训练深度神经网络的基础:新理论和算法
- 批准号:
2008981 - 财政年份:2020
- 资助金额:
$ 49.9万 - 项目类别:
Continuing Grant
III: Small: Collaborative Research: Algorithms, systems, and theories for exploiting data dependencies in crowdsourcing
III:小型:协作研究:在众包中利用数据依赖性的算法、系统和理论
- 批准号:
2008155 - 财政年份:2020
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
III: Small: Stochastic Algorithms for Large Scale Data Analysis
III:小型:大规模数据分析的随机算法
- 批准号:
1908104 - 财政年份:2019
- 资助金额:
$ 49.9万 - 项目类别:
Continuing Grant
III: Small: Novel Geometric Algorithms for Learning from Big Biomedical Data
III:小:从生物医学大数据中学习的新型几何算法
- 批准号:
1910492 - 财政年份:2019
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
III: Small: New algorithms for genome skimming and its applications
III:小:基因组略读的新算法及其应用
- 批准号:
1815485 - 财政年份:2018
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
III: Small: Algorithms and Practical Applications for Team Formation and Change
III:小:团队组建和变革的算法和实际应用
- 批准号:
1813406 - 财政年份:2018
- 资助金额:
$ 49.9万 - 项目类别:
Standard Grant
III: Small: Algorithms and Theoretical Foundations for Approximate Bayesian Inference in Machine Learning
III:小:机器学习中近似贝叶斯推理的算法和理论基础
- 批准号:
1906694 - 财政年份:2018
- 资助金额:
$ 49.9万 - 项目类别:
Continuing Grant