Fast k-mer Counting to Quantify Gene Expression and Improve Genome Assembly

快速 k-mer 计数可量化基因表达并改善基因组组装

基本信息

  • 批准号:
    8642468
  • 负责人:
  • 金额:
    $ 24.06万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-08-01 至 2015-04-30
  • 项目状态:
    已结题

项目摘要

DESCRIPTION (provided by applicant): We propose to investigate new computational approaches to two central problems of high-throughput se- quence analysis: (1) quantification of transcript and species abundance in RNAseq and metagenomic data, and (2) improved error correction of sequencing reads. The proposed novel approaches to both of these problems derive from the ability to quickly count every instance of every k-mer (string of length k) within huge collections of sequence data. Extensive preliminary work on this problem, manifest in the k-mer counting software (called Jellyfish) published by the project personnel, will be brought to bear and extended. Existing mapping-based computational techniques for quantifying transcript abundance have found wide applicability but read mapping is error prone due to, e.g., splice junctions, microexons, and variation from the reference sequence. Aim 1 seeks to develop an alternative, mapping-free approach to transcript quantification from sequencing data that relies on clustering normalized k-mer count vectors to identify k-mers that are indicative of transcript or gene abundance. These k-mers form profiles that can be used to rapidly quantify expression of the given transcript or gene in subsequent experiments with limited computational effort and avoiding the challenging read mapping step. Aim 2 tackles the problem of error correction of genomic, and, more speculatively, RNAseq reads by developing more accurate k-mer filtering methods and more compact de Bruijn graph representations. The new filtering proce- dures try to make a better distinction between correct and erroneous k-mers by simultaneously considering their position within the reads and the distribution of their quality scores across reads. Improved error correction and de Bruijn graph representations will be used for more efficient algorithms for super-read and unitig creation, the initial stages of assembly. The methods and software developed for both aims will significantly increase the ability of high-throughput sequence analysis and assembly to be completed on widely available commodity computers.
描述(由申请人提供):我们建议研究新的计算方法来解决高通量序列分析的两个核心问题:(1)RNAseq和宏基因组数据中转录物和物种丰度的量化,以及(2)改进测序reads的纠错。提出的解决这两个问题的新方法源于在庞大的序列数据集合中快速计数每个k-mer(长度为k的字符串)的每个实例的能力。在这个问题上广泛的初步工作,体现在k-mer计数软件(称为水母)由项目人员发布,将带来承担和扩展。现有的基于定位的转录本丰度定量计算技术已经发现了广泛的适用性,但由于剪接、微外显子和参考序列的变化等原因,读取定位容易出错。Aim 1旨在开发一种替代的、无图谱的方法来从测序数据中进行转录物定量,该方法依赖于聚类归一化k-mer计数载体来鉴定转录物或基因丰度的k-mers。这些k-mers形成的谱可以用于在随后的实验中快速量化给定转录物或基因的表达,只需有限的计算工作量,并避免具有挑战性的读取映射步骤。目标2通过开发更精确的k-mer过滤方法和更紧凑的de Bruijn图表示来解决基因组错误校正问题,并且更有推测性地解决RNAseq读取问题。新的过滤程序通过同时考虑k-mers在reads中的位置和它们在reads中的质量分数分布,试图更好地区分正确和错误的k-mers。改进的纠错和de Bruijn图表示将用于更有效的算法,用于超级读取和统一创建,组装的初始阶段。为这两个目标开发的方法和软件将大大提高在广泛可用的商用计算机上完成高通量序列分析和组装的能力。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Carleton Lee Kingsford其他文献

Carleton Lee Kingsford的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Carleton Lee Kingsford', 18)}}的其他基金

Improved genomic sketching for MUMmer and metagenomics
改进了 MUMmer 和宏基因组的基因组草图
  • 批准号:
    10453031
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
Improved genomic sketching for MUMmer and metagenomics
改进了 MUMmer 和宏基因组的基因组草图
  • 批准号:
    10670162
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
Data Discovery: Computational Methods for Searching Short-Read Sequencing Experiments
数据发现:搜索短读测序实验的计算方法
  • 批准号:
    9287168
  • 财政年份:
    2017
  • 资助金额:
    $ 24.06万
  • 项目类别:
Data Discovery: Computational Methods for Searching Short-Read Sequencing Experiments - Administrative Supplement
数据发现:搜索短读测序实验的计算方法 - 行政补充
  • 批准号:
    10393953
  • 财政年份:
    2017
  • 资助金额:
    $ 24.06万
  • 项目类别:
Algorithms for Managing Uncertainty in Chromosome Conformation Capture Data
管理染色体构象捕获数据不确定性的算法
  • 批准号:
    8739540
  • 财政年份:
    2013
  • 资助金额:
    $ 24.06万
  • 项目类别:
Algorithms for Managing Uncertainty in Chromosome Conformation Capture Data
管理染色体构象捕获数据不确定性的算法
  • 批准号:
    8579049
  • 财政年份:
    2013
  • 资助金额:
    $ 24.06万
  • 项目类别:
Fast k-mer Counting to Quantify Gene Expression and Improve Genome Assembly
快速 k-mer 计数可量化基因表达并改善基因组组装
  • 批准号:
    8518438
  • 财政年份:
    2012
  • 资助金额:
    $ 24.06万
  • 项目类别:
Accurate Computational Detection of Influenza Reassortments
流感重组的准确计算检测
  • 批准号:
    8072578
  • 财政年份:
    2010
  • 资助金额:
    $ 24.06万
  • 项目类别:
Accurate Computational Detection of Influenza Reassortments
流感重组的准确计算检测
  • 批准号:
    7772829
  • 财政年份:
    2010
  • 资助金额:
    $ 24.06万
  • 项目类别:

相似国自然基金

酪氨酸蛋白激酶Mer受体介导胃癌抗PD-1/PD-L1治疗耐药的作用机制研究
  • 批准号:
    JCZRLH202500772
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
制商陆果阻断Mer酪氨酸激酶N-糖基化修饰抑制HIF-1α-VEGF信号通路抗肝癌细胞增殖
  • 批准号:
    2025JJ70131
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
紫草素下调PKM2抑制MER11乳酸化阻断同源重组克服胃癌5-FU耐药的机制研究
  • 批准号:
    2025JJ60655
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
内源性逆转录病毒MER65-int调控人类胎 盘发育与子宫内膜重塑的功能研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
神经保护PEDF17-mer基序结构域对干性AMD的保护作用及开发应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
基于必需同源特征与相位特异K-mer频率的真核生物通用的必需基因理论识别模型
  • 批准号:
    32370696
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
MER41家族转座子在人类胎盘转录调控网络中的功能和调控机制
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
巨细胞病毒感染抑制Mer受体络氨酸激酶促进M1型巨噬细胞极化打破移植免疫耐受的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于mER信号通路探讨针灸对乳腺发育的影响
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    34 万元
  • 项目类别:
    地区科学基金项目
细菌种水平基因组特异序列挖掘及数据库的建立
  • 批准号:
    32000474
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

K-mer indexing for pan-genome reference annotation
用于泛基因组参考注释的 K-mer 索引
  • 批准号:
    10793082
  • 财政年份:
    2023
  • 资助金额:
    $ 24.06万
  • 项目类别:
Decoding the molecular basis of phytopathogen evolution in the fungal kingdom
解码真菌界植物病原体进化的分子基础
  • 批准号:
    22K20583
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Effets de la hausse du niveau de la mer sur les marais maritimes
滨海玛黑区滨海之家的影响
  • 批准号:
    572259-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
    University Undergraduate Student Research Awards
Réponseécogéomorphologique des écosystèmes côtiers des Îles-de-la-Madeleine à la hausse récente du niveau de la mer
玛德琳堡和豪斯中心的舒适系统中心的响应式形态
  • 批准号:
    575527-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
A k-mer-based search engine for sequencing databases
基于 k-mer 的测序数据库搜索引擎
  • 批准号:
    2138585
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
    Continuing Grant
The role of MER/PROS1 in promoting stromal induced emergence from metastatic melanoma dormancy
MER/PROS1 在促进基质诱导的转移性黑色素瘤休眠中的作用
  • 批准号:
    10526077
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
Indicateurs géoécologiques du couvert de glace de mer en milieu portuaire subarctique
波尔图亚北极地区海洋冰川地质指标
  • 批准号:
    572528-2022
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
    Alexander Graham Bell Canada Graduate Scholarships - Master's
Développement de produits analogues de poissons et de fruits de mer à partir de protéines végétales
鱼肉类似物产品和鱼肉水果的开发
  • 批准号:
    552464-2020
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
    Applied Research and Development Grants - Level 2
Gas6/Merシグナルを標的とした新型コロナウイルスによる血栓症対策
针对Gas6/Mer信号对抗新型冠状病毒引起的血栓形成的对策
  • 批准号:
    22K08510
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Leveraging k-mer sketching statistics to enhance metagenomic methods and alignment algorithms
利用 k-mer 草图统计来增强宏基因组方法和比对算法
  • 批准号:
    10675449
  • 财政年份:
    2022
  • 资助金额:
    $ 24.06万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了