III: Small: Computational Methods for Analyzing Complex Genomes with Sequence Data

III:小:用序列数据分析复杂基因组的计算方法

基本信息

  • 批准号:
    1526415
  • 负责人:
  • 金额:
    $ 42.63万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2020-08-31
  • 项目状态:
    已结题

项目摘要

High-throughput sequencing is one of the most important technologies in biological research. While many species have been sequenced and analyzed, there are still many species whose genomes are not well studied. One reason is that some species have more complex genomes than others. For example, it is well-known that there are many species with large amount of repeats in their genomes. At present, many such highly repetitive genomes do not have good reference genomes. There are few existing computational tools for analyzing highly repetitive genomes from raw sequence reads when there are no reference genomes. Also, even when reference genomes are available, there may still be complex genomic regions not present in the reference genome. Methods relying on reference genomes may not work well on these regions.The broader impacts of the project include interdisciplinary collaboration between a computer scientist and a population biologist. Software to facilitate the analysis of complex genomes may have impact outside of computer science, by being of significant use to geneticists. Developed software tools will be made available freely to the multi-disciplinary research community, and are expected to enable novel biological applications of high-throughput sequencing. Research results will be integrated into classroom teaching. We will ensure broad dissemination of our research results and teaching materials. The intellectual merits include the development of new computational tools for analyzing highly repetitive genomes from sequence reads directly. Our methods do not assume the existence of reference genomes. Instead, we plan to develop methods that perform de novo assembly of highly repetitive genomic regions from the sequence reads, and estimate the number of repeat copies. We also plan to investigate the impact of repeats on the quality of reference genomes. At last, we plan to develop methods for studying the evolutionary history of repeats from sequence reads. The PI will leverage his previous experience with algorithm design for sequence analysis and population genomics problems. The expected project outcome includes efficient algorithms for the analysis of complex genome, related open-source software tools, and rigorous methodologies for both theoretical and empirical evaluation of the algorithms. Part of the contribution to computer science by this project is that the study of algorithms for handling large amount of sequence reads may contribute to string matching, which is a classic computer science problem. Due to the size of sequence data, algorithmic efficiency will be central to this project. Complex genome analysis provides new perspectives and formulations to various combinatorial algorithmic problems. Such formulations may raise interests in theoretical computer science community.
高通量测序是生物学研究中最重要的技术之一。虽然许多物种已被测序和分析,但仍有许多物种的基因组尚未得到很好的研究。原因之一是有些物种的基因组比其他物种更复杂。例如,众所周知,许多物种在其基因组中具有大量重复序列。目前,许多这样的高度重复的基因组没有良好的参考基因组。当没有参考基因组时,现有的用于从原始序列读数分析高度重复的基因组的计算工具很少。此外,即使当参考基因组可用时,仍可能存在参考基因组中不存在的复杂基因组区域。依靠参考基因组的方法在这些区域可能不起作用。该项目更广泛的影响包括计算机科学家和人口生物学家之间的跨学科合作。促进复杂基因组分析的软件可能对计算机科学之外的领域产生影响,因为它对遗传学家有重要作用。开发的软件工具将免费提供给多学科研究界,并有望实现高通量测序的新生物学应用。研究成果将融入课堂教学。我们将确保广泛传播我们的研究成果和教材。智力上的优点包括开发新的计算工具,用于直接从序列读数分析高度重复的基因组。我们的方法不假设参考基因组的存在。相反,我们计划开发从序列读数中重新组装高度重复的基因组区域的方法,并估计重复拷贝的数量。我们还计划研究重复序列对参考基因组质量的影响。最后,我们计划开发用于从序列读数研究重复序列的进化历史的方法。PI将利用他以前在序列分析和群体基因组学问题算法设计方面的经验。项目的预期成果包括复杂基因组分析的有效算法、相关的开放源码软件工具以及对算法进行理论和经验评估的严格方法。该项目对计算机科学的部分贡献是,处理大量序列读取的算法的研究可能有助于字符串匹配,这是一个经典的计算机科学问题。由于序列数据的大小,算法效率将是这个项目的核心。复杂基因组分析为各种组合算法问题提供了新的视角和公式。这样的公式可能会引起理论计算机科学界的兴趣。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yufeng Wu其他文献

Melamine sponge skeleton loaded organic conductors for mechanical sensors with high sensitivity and high resolution
三聚氰胺海绵骨架负载有机导体用于高灵敏度和高分辨率机械传感器
  • DOI:
    10.1007/s42114-022-00581-5
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    20.1
  • 作者:
    Yufeng Wu;Jianbo Wu;Yan Lin;Junchen Liu;Xiaolong Pan;Xian He;Ke Bi;Ming Lei
  • 通讯作者:
    Ming Lei
Embedding Guide: Improving Watermarking Robustness and Imperceptibility based on Attention and Edge Information
嵌入指南:基于注意力和边缘信息提高水印的鲁棒性和不可察觉性
Applying cross-scale regulations to <em>Sedum plumbizincicola</em> for strengthening the bioremediation of the agricultural soil that contaminated by electronic waste dismantling and revealing the underlying mechanisms by multi-omics
  • DOI:
    10.1016/j.envres.2024.120406
  • 发表时间:
    2025-01-01
  • 期刊:
  • 影响因子:
  • 作者:
    Linbin Wang;Yufeng Wu;Zhi-Bo Zhao;Tingsheng Jia;Wenjuan Liu
  • 通讯作者:
    Wenjuan Liu
Unraveling the degradation mechanism of nitrobenzene in excess oxygen triggered by HO• from DFT and kinetic insights
从密度泛函理论(DFT)和动力学角度揭示过量氧气中由羟基自由基(HO•)引发的硝基苯降解机制
  • DOI:
    10.1016/j.psep.2025.107222
  • 发表时间:
    2025-06-01
  • 期刊:
  • 影响因子:
    7.800
  • 作者:
    Yufeng Wu;Runlai Ji;Zongyi Yu;Mingshu Bi;Dongcheng Yang
  • 通讯作者:
    Dongcheng Yang
Impacts of change in multiple cropping index of rice on hydrological components and grain production in the Zishui River Basin, Southern China
中国南方资水流域水稻复种指数变化对水文要素及粮食生产的影响
  • DOI:
    10.1016/j.agwat.2025.109572
  • 发表时间:
    2025-07-01
  • 期刊:
  • 影响因子:
    6.500
  • 作者:
    Chengcheng Yuan;Xinlin Li;Yufeng Wu;Gary W. Marek;Srinivasulu Ale;Raghavan Srinivasan;Yong Chen
  • 通讯作者:
    Yong Chen

Yufeng Wu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Yufeng Wu', 18)}}的其他基金

III: Small: Computational Methods for Ancestry Inference In Genetics
III:小:遗传学中祖先推断的计算方法
  • 批准号:
    1909425
  • 财政年份:
    2019
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
AF: Small: Computational Methods for Large-scale Inference of Population History
AF:小型:人口历史大规模推断的计算方法
  • 批准号:
    1718093
  • 财政年份:
    2017
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
AF: Small: Algorithms for Reconstructing Complex Evolutionary History with Discordant Phylogenetic Trees
AF:小:用不一致的系统发育树重建复杂进化历史的算法
  • 批准号:
    1116175
  • 财政年份:
    2011
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
CAREER: Efficient and Accurate Computation for High Throughput Sequencing Related Problems in Population Genomics
职业:群体基因组学中高通量测序相关问题的高效、准确计算
  • 批准号:
    0953563
  • 财政年份:
    2010
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Continuing Grant
III-CXT-Medium: Collaborative Research: Inference of Complex Genealogical Histories in Populations: Algorithms and Applications
III-CXT-Medium:协作研究:群体中复杂谱系历史的推断:算法和应用
  • 批准号:
    0803440
  • 财政年份:
    2008
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: Computational Methods for Multi-dimensional Data Integration to Improve Phenotype Prediction
III:小:多维数据集成的计算方法以改进表型预测
  • 批准号:
    2246796
  • 财政年份:
    2023
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
III: Small: RareXplain: A Computational Framework for Explainable Rare Category Analysis
III:小:RareXplain:可解释稀有类别分析的计算框架
  • 批准号:
    2117902
  • 财政年份:
    2021
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
III: Small: Computational Methods for Ancestry Inference In Genetics
III:小:遗传学中祖先推断的计算方法
  • 批准号:
    1909425
  • 财政年份:
    2019
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
III: Small: ACM BCB 2019: Conference on Bioinformatics, Computational Biology, and Health Informatics
III:小型:ACM BCB 2019:生物信息学、计算生物学和健康信息学会议
  • 批准号:
    1940310
  • 财政年份:
    2019
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Collaborative Research: Databases Meet Computational Social Choice
NSF-BSF:III:小型:协作研究:数据库满足计算社会选择
  • 批准号:
    1916647
  • 财政年份:
    2018
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Collaborative Research: Databases Meet Computational Social Choice
NSF-BSF:III:小型:协作研究:数据库满足计算社会选择
  • 批准号:
    1813888
  • 财政年份:
    2018
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
III: Small: Mirador: Explainable Computational Models for Recognizing and Understanding Controversial Topics Encountered Online
III:小:Mirador:用于识别和理解网上遇到的有争议话题的可解释计算模型
  • 批准号:
    1813662
  • 财政年份:
    2018
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
NSF-BSF: III: Small: Collaborative Research: Databases Meet Computational Social Choice
NSF-BSF:III:小型:协作研究:数据库满足计算社会选择
  • 批准号:
    1814152
  • 财政年份:
    2018
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
III: Small: Exploiting and Extending Integer Linear Programming in Computational Biology
III:小:在计算生物学中利用和扩展整数线性规划
  • 批准号:
    1528234
  • 财政年份:
    2015
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
III: Small: Sampling Techniques in Computational Logic
III:小:计算逻辑中的采样技术
  • 批准号:
    1527668
  • 财政年份:
    2015
  • 资助金额:
    $ 42.63万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了