III: Small: Collaborative Research: A Scalable and Efficient Optical Map Assembler

III:小型:协作研究:可扩展且高效的光学地图组装器

基本信息

  • 批准号:
    1618814
  • 负责人:
  • 金额:
    $ 38.4万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-10-01 至 2021-09-30
  • 项目状态:
    已结题

项目摘要

Optical mapping is a laboratory technique for constructing ordered high-resolution optical maps from stained molecules of DNA. The popularity of this type of data has amplified because the commercial production of the data has improved in terms of quality, expense, and throughput. For example, BioNano Genomics released a new generation of optical mapping technology called the Irys System in 2015, which has been used to uncover diploid variation in the human genome. However, the raw optical mapping data, called Rmaps, is not inherently useful by itself and must be first assembled into a genome-wide optical map; a computational process that has very few nonproprietary solutions. The optical map assembly problem that aims to stich together the Rmap data into a genome-wide optical map has some similarities to genome assembly that aims to build contiguous sequences corresponding to the genome of interest from short sequence reads. Although this similarity exists, there are some significant differences that have prevented the direct application of genome assemblers to this latter problem. The main objective of this proposed work is to build a scalable and efficient optical map assembler through the exploration and adaptation of genome assembly algorithms and methods. This research objective will be enhanced by an education plan that aims to broaden the participation in computer science by creating research opportunities for female graduate students, as well as, high school senior students. The plan is to redevelop the existing bioinformatics graduate course so that it: (1) can be cross-listed with the Department of Biology and thus, increase the female enrolment, and (2) will be project based and thus, produce supportive relationships between female students. The team will conduct comprehensive surveys of graduate students in the redeveloped course, as well as the other graduate courses in computer science, to determine whether the changes are impactful. We plan to disseminate our findings to other institutions.Even with significantly high coverage and various insert sizes, genome assembly and structural variation detection are tenuous computational processes using short read data alone due to repetitive regions in the genome. Optical maps, which are ordered genome-wide high-resolution restriction maps that specify the positions of occurrence of one or more short nucleotide sequences, are one such type of data. The raw optical mapping data identified by the image processing is an ordered sequence of fragment lengths. The (unassembled) optical mapping data produced by the system are referred to as Rmaps and are synonymous with sequence reads in standard genome sequencing. Optical mapping has gained popularity due to (1) the ability to automate the generation of the data; and (2) its use in several large sequencing projects---including the sequencing projects of goat, budgerigar, and Ambler trichopoda. With this popularity comes the growing need for means to analyze optical mapping data. The goal of this proposed work is to build an optical map assembler that is efficient for genomes of various sizes that will accept as input a set of Rmaps and return an assembled genome-wide optical map. Thus, we have divided this larger goal into the following intermediate research objectives that we plan to tackle in succession: (1) Develop a Rmap error correction method; (2) create a robust alignment algorithm; and (3) create a succinct graph representation of a genome wide optical map. Our algorithmic contributions are not limited to optical mapping data but can be extended to other type of data, e.g., PacBio and genetic linkage maps. We will actively engage in knowledge transfer through these research objectives and our outreach and education plan. These efforts will redevelop a bioinformatics course in order to attract a greater number of female students and foster collaborative relationships, and continue an ongoing high school outreach program. In addition to these activities, we will survey the students in the redeveloped course and other graduate classes to see whether the changes were impactful, and mentor a senior high school student researcher during the summers.
光学映射是一种实验室技术,用于从染色的DNA分子构建有序的高分辨率光学映射。 这种类型的数据的受欢迎程度已经扩大,因为数据的商业生产在质量,费用和吞吐量方面有所改善。例如,BioNano Genomics在2015年发布了新一代光学映射技术Irys System,该技术已用于揭示人类基因组中的二倍体变异。 然而,原始的光学映射数据,称为Rmaps,本身并不是天生有用的,必须首先组装成一个全基因组的光学地图;一个计算过程,有很少的非专有解决方案。旨在将Rmap数据斯蒂奇到全基因组光学图谱中的光学图谱组装问题与旨在从短序列读段构建对应于感兴趣基因组的连续序列的基因组组装具有一些相似性。 虽然存在这种相似性,但存在一些显著的差异,这些差异阻止了基因组组装器直接应用于后一个问题。 本文的主要目标是通过对基因组组装算法和方法的探索和改进,构建一个可扩展的高效的光学图谱组装器。这项研究目标将通过一项教育计划得到加强,该计划旨在通过为女研究生和高中高年级学生创造研究机会,扩大对计算机科学的参与。 计划重新开发现有的生物信息学研究生课程,以便:(1)与生物系交叉列出,从而增加女生入学率;(2)以项目为基础,从而在女生之间建立支持关系。 该团队将对重新开发的课程的研究生以及计算机科学的其他研究生课程进行全面调查,以确定这些变化是否具有影响力。 我们计划将我们的发现传播给其他机构。即使具有显著高的覆盖率和各种插入大小,由于基因组中的重复区域,仅使用短读段数据的基因组组装和结构变异检测是脆弱的计算过程。 光学图谱是有序的全基因组高分辨率限制性图谱,其指定一个或多个短核苷酸序列的出现位置,是这样一种类型的数据。通过图像处理识别的原始光学映射数据是片段长度的有序序列。系统产生的(未组装的)光学映射数据被称为Rmaps,与标准基因组测序中的序列读数同义。 光学图谱已经得到普及,因为(1)能够自动生成数据;(2)它在几个大型测序项目中的使用-包括山羊、虎皮鹦鹉和Ambler Appropoda的测序项目。 随着这种普及,对分析光学测绘数据的手段的需求日益增长。 这项工作的目标是建立一个光学地图汇编程序,是有效的各种大小的基因组,将接受作为输入的一组Rmaps和返回组装的全基因组光学地图。 因此,我们将这个更大的目标分为以下中期研究目标,我们计划连续解决:(1)开发Rmap错误校正方法;(2)创建一个强大的比对算法;(3)创建一个简洁的全基因组光学图谱的图形表示。我们的算法贡献不限于光学映射数据,而是可以扩展到其他类型的数据,例如,PacBio和遗传连锁图谱。我们将通过这些研究目标和我们的推广和教育计划积极参与知识转移。这些努力将重新开发生物信息学课程,以吸引更多的女学生和促进合作关系,并继续进行一项正在进行的高中外联方案。除了这些活动,我们将调查学生在重新开发的课程和其他研究生班,看看这些变化是否有影响力,并指导高中学生研究员在夏季。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christina Boucher其他文献

ONeSAMP 3.0: Effective Population Size via SNP Data for One Population Sample
ONeSAMP 3.0:通过一个群体样本的 SNP 数据获得有效群体规模
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aaron Hong;R. G. Cheek;Kingshuk Mukherjee;Isha Yooseph;Marco Oliva;Mark Heim;W. C. Funk;David Tallmon;Christina Boucher
  • 通讯作者:
    Christina Boucher
Data Structures for SMEM-Finding in the PBWT
PBWT 中 SMEM 查找的数据结构
  • DOI:
    10.1007/978-3-031-43980-3_8
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    5.4
  • 作者:
    Paola Bonizzoni;Christina Boucher;D. Cozzi;Travis Gagie;Dominik Köppl;Massimiliano Rossi
  • 通讯作者:
    Massimiliano Rossi
A study at the wildlife-livestock interface unveils the potential of feral swine as a reservoir for extended-spectrum β-lactamase-producing emEscherichia coli/em
一项针对野生动物与家畜交界地区的研究揭示了野猪作为产超广谱β-内酰胺酶大肠埃希菌宿主的潜力。
  • DOI:
    10.1016/j.jhazmat.2024.134694
  • 发表时间:
    2024-07-15
  • 期刊:
  • 影响因子:
    11.300
  • 作者:
    Ting Liu;Shinyoung Lee;Miju Kim;Peixin Fan;Raoul K. Boughton;Christina Boucher;Kwangcheol C. Jeong
  • 通讯作者:
    Kwangcheol C. Jeong
A comparative study of antibiotic resistance patterns in Mycobacterium tuberculosis
结核分枝杆菌抗生素耐药模式的比较研究
  • DOI:
    10.1038/s41598-025-89087-w
  • 发表时间:
    2025-02-11
  • 期刊:
  • 影响因子:
    3.900
  • 作者:
    Mohammadali Serajian;Conrad Testagrose;Mattia Prosperi;Christina Boucher
  • 通讯作者:
    Christina Boucher
Solving the Minimal Positional Substring Cover Problem in Sublinear Space
解决次线性空间中的最小位置子串覆盖问题

Christina Boucher的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christina Boucher', 18)}}的其他基金

Collaborative Research: EAGER: Solving the bait learning problem for large-scale DNA enrichment
合作研究:EAGER:解决大规模 DNA 富集的诱饵学习问题
  • 批准号:
    2118251
  • 财政年份:
    2021
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
SCH: INT: Enabling real time surveillance of antimicrobial resistance
SCH:INT:实现抗菌药物耐药性的实时监测
  • 批准号:
    2013998
  • 财政年份:
    2021
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
IIBR Informatics: An Efficient Pangenomics Graph Aligner
IIBR 信息学:高效的泛基因组图对齐器
  • 批准号:
    2029552
  • 财政年份:
    2020
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336768
  • 财政年份:
    2024
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324770
  • 财政年份:
    2023
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311598
  • 财政年份:
    2023
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
  • 批准号:
    2316306
  • 财政年份:
    2023
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
  • 批准号:
    2324769
  • 财政年份:
    2023
  • 资助金额:
    $ 38.4万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了