A k-mer-based search engine for sequencing databases
基于 k-mer 的测序数据库搜索引擎
基本信息
- 批准号:2138585
- 负责人:
- 金额:$ 80万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2022
- 资助国家:美国
- 起止时间:2022-09-01 至 2025-08-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Databases with biological sequencing data hold a treasure trove of biological data that can be used to aid experimental design and find relevant prior experiments for new biological projects. However, these rapidly growing archives are heavily under-utilized due to our inability to rapidly query the raw data within them. Just as search engines transformed our ability to broadly and deeply access information online, search indices have the potential to revolutionize the ways in which sequencing data in these archives is used. In this project methods to enable fast and easy access to these databases will be developed. This will contribute to the “Googlification” of life-science data, spurring broad scientific advances. Additionally, as part of the project, a “Writing in CS” course as well as an exercise booklet for probabilistic analysis of algorithms will be developed. Workshops on emerging methods for sequence analysis will be organized, and training to underrepresented undergraduates, graduate students and postdocs will be provided. This project advances research across all areas of life science that work with sequencing data. It createspowerful indexing data structures and querying algorithms for databases of sequencing experiments. This can allow biologists to query sequencing databases to find experiments which express a certain transcript of interest, show differential levels of expression between two transcripts, contain a known splice junction or gene fusion, or contain a small genome of interest. This project will facilitate a biologist to be able to execute many biologically-stated queries on a database of raw DNA and RNA sequencing experiments. The results of this project will be available on http://medvedevgroup.com/nsf-iibr-project.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
具有生物测序数据的数据库保存着生物数据的宝库,这些数据可用于辅助实验设计并为新的生物项目找到相关的先前实验。然而,由于我们无法快速查询其中的原始数据,这些快速增长的档案严重未得到充分利用。正如搜索引擎改变了我们广泛深入地访问在线信息的能力一样,搜索索引有可能彻底改变这些档案中测序数据的使用方式。在这个项目中,将开发能够快速和方便地访问这些数据库的方法。这将有助于生命科学数据的“谷歌化”,推动广泛的科学进步。此外,作为该项目的一部分,将开发“CS写作”课程以及算法概率分析练习手册。将组织关于新出现的序列分析方法的讲习班,并将向代表性不足的本科生、研究生和博士后提供培训。该项目推进了与测序数据相关的生命科学所有领域的研究。它为测序实验数据库提供了强大的索引数据结构和查询算法。这可以允许生物学家查询测序数据库,以找到表达某种感兴趣的转录本、显示两种转录本之间的差异表达水平、包含已知的剪接点或基因融合或包含感兴趣的小基因组的实验。该项目将促进生物学家能够对原始DNA和RNA测序实验的数据库执行许多生物学陈述的查询。该项目的结果将在www.example.com上公布http://medvedevgroup.com/nsf-iibr-project.This奖项反映了NSF的法定使命,并被认为值得通过使用基金会的知识价值和更广泛的影响审查标准进行评估来支持。
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Efficient mapping of accurate long reads in minimizer space with mapquik.
- DOI:10.1101/gr.277679.123
- 发表时间:2023-07
- 期刊:
- 影响因子:7
- 作者:Ekim, Baris;Sahlin, Kristoffer;Medvedev, Paul;Berger, Bonnie;Chikhi, Rayan
- 通讯作者:Chikhi, Rayan
Compression Algorithm for Colored de Bruijn Graphs
彩色 de Bruijn 图的压缩算法
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Rahman, Amatur;Dufresne, Yoann;Medvedev, Paul
- 通讯作者:Medvedev, Paul
Exact Sketch-Based Read Mapping
精确的基于草图的读取映射
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Schulz, Tizian;Medvedev, Paul
- 通讯作者:Medvedev, Paul
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Paul Medvedev其他文献
Constructing and personalizing population pangenome graphs
构建和个性化群体泛基因组图谱
- DOI:
10.1038/s41592-024-02402-7 - 发表时间:
2024-10-21 - 期刊:
- 影响因子:32.100
- 作者:
Rayan Chikhi;Yoann Dufresne;Paul Medvedev - 通讯作者:
Paul Medvedev
Theoretical Analysis of Edit Distance Algorithms
- DOI:
10.1145/3582490 - 发表时间:
2023-11 - 期刊:
- 影响因子:22.7
- 作者:
Paul Medvedev - 通讯作者:
Paul Medvedev
PLA-complexity of k-mer multisets
k-mer 多重集的 PLA 复杂性
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Md. Hasin Abrar;Paul Medvedev - 通讯作者:
Paul Medvedev
Proceedings of the SeqBio 2015 workshop: String algorithms for bioinformatics
SeqBio 2015 研讨会论文集:生物信息学的字符串算法
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
A. Denise;O. Lespinet;Mireille Régnier;Groupement De;Recherche BioInformatique;Guillaume Blin;Christine Gaspin;Vincent Lacroix;Leandro Lima;Hélène Lopez;M. Sagot;B. Sinaimeri;C. Marchet;Clara Benoit;Frank Picard;Alice Julien;J. Kielbassa;Lilia Brînză;Bastien Cazaux;Eric Rivals;Matthieu Rosenfeld;Micha¨el Rao;G. Fici;Tomasz Kociumaka;T. Lecroq;A. Lefebvre;Élise Prieur;A. Radulescu;G. Fertin;Géraldine Jean;I. Rusu;Yoann Dufresne;Laurent Noé;V. Leclère;Maude Pupin;Gaëtan Benoit;C. Lemaitre;D. Lavenier;E. Drezen;Guillaume Rizk;R. Uricaru;R. Chikhi;A. Limasset;P. Peterlongo;Bashar Al;Roxane Mallouhi;Bassam AlKindy;C. Guyeux;Jean;J. Na;Hyunjoon Kim;Heejin Park;Martine Léonard;L. Mouchard;Kunsoo Park;Evgenia Furletova;Mireille Régnier;Jan Holub;Gilles Didier;Laurent Tichit;Morgane Thomas;M. Sagot;Micha¨el Rao;´Elise Prieur;V. Leclère;Gaëtan Benoit;Thibault Dayris;Shaun Jackman;Jared T Simpson;Paul Medvedev;Can Alkan;Cécile Monat;Christine Tranchant;Michel Salomon;Jean;Joong Chae;©. Joong;Chae Na;Mark Daniel Ward;Vincent Le Gallic;Yann Ponty;Cedric Chauve;J. Courtiel - 通讯作者:
J. Courtiel
Computational methods for discovering structural variation with next-generation sequencing
利用下一代测序技术发现结构变异的计算方法
- DOI:
10.1038/nmeth.1374 - 发表时间:
2009-10-15 - 期刊:
- 影响因子:32.100
- 作者:
Paul Medvedev;Monica Stanciu;Michael Brudno - 通讯作者:
Michael Brudno
Paul Medvedev的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Paul Medvedev', 18)}}的其他基金
CAREER: De Novo Assembly of Large Genomic Data
职业:大型基因组数据的从头组装
- 批准号:
1453527 - 财政年份:2015
- 资助金额:
$ 80万 - 项目类别:
Continuing Grant
ABI Innovation: A Novel Framework for Detecting Genomic Structural Variation
ABI Innovation:检测基因组结构变异的新框架
- 批准号:
1356529 - 财政年份:2014
- 资助金额:
$ 80万 - 项目类别:
Standard Grant
相似国自然基金
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
Incentive and governance schenism study of corporate green washing behavior in China: Based on an integiated view of econfiguration of environmental authority and decoupling logic
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国学者研究基金项目
Exploring the Intrinsic Mechanisms of CEO Turnover and Market Reaction: An Explanation Based on Information Asymmetry
- 批准号:W2433169
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国学者研究基金项目
含Re、Ru先进镍基单晶高温合金中TCP相成核—生长机理的原位动态研究
- 批准号:52301178
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
NbZrTi基多主元合金中化学不均匀性对辐照行为的影响研究
- 批准号:12305290
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
眼表菌群影响糖尿病患者干眼发生的人群流行病学研究
- 批准号:82371110
- 批准年份:2023
- 资助金额:49.00 万元
- 项目类别:面上项目
镍基UNS N10003合金辐照位错环演化机制及其对力学性能的影响研究
- 批准号:12375280
- 批准年份:2023
- 资助金额:53.00 万元
- 项目类别:面上项目
CuAgSe基热电材料的结构特性与构效关系研究
- 批准号:22375214
- 批准年份:2023
- 资助金额:50.00 万元
- 项目类别:面上项目
A study on prototype flexible multifunctional graphene foam-based sensing grid (柔性多功能石墨烯泡沫传感网格原型研究)
- 批准号:
- 批准年份:2020
- 资助金额:20 万元
- 项目类别:
基于大数据定量研究城市化对中国季节性流感传播的影响及其机理
- 批准号:82003509
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Prompt-Based and Contrastive Learning for Sensitivity-Aware Search
用于敏感性感知搜索的基于提示和对比的学习
- 批准号:
2812964 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Studentship
Search for therapeutic target molecules based on temporal hierarchical analysis of Oral squamous cell carcinoma and functional RNA molecules
基于口腔鳞状细胞癌和功能RNA分子的时间层次分析寻找治疗靶分子
- 批准号:
23K16142 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Enhancing Effectiveness of a Dissonance-Based Obesity Prevention Program
提高基于失调的肥胖预防计划的有效性
- 批准号:
10849600 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Experience-based and intentional suppression of distracting information
基于经验和有意抑制分散注意力的信息
- 批准号:
10717468 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Michigan Institute for Clinical and Health Research (MICHR)
密歇根临床与健康研究所 (MICHR)
- 批准号:
10621051 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Applied Curriculum in Gender and Equity Skills (ACES)
性别与平等技能应用课程(ACES)
- 批准号:
10731498 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Proposal for A Stochastic-Signal-Model-Based Search for Intermittent Gravitational-Wave Backgrounds
基于随机信号模型的间歇引力波背景搜索提案
- 批准号:
2400301 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Continuing Grant
Continually Adaptive Machine Learning Platform for Personalized Biomedical Literature Curation and Exploration
用于个性化生物医学文献管理和探索的持续自适应机器学习平台
- 批准号:
10660315 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Study for galaxy evolution in dense environment based on a systematic search for galaxy protoclusters
基于系统搜索星系原团的稠密环境下星系演化研究
- 批准号:
22KJ0834 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Grant-in-Aid for JSPS Fellows
Verification of teaching effectiveness based on a elementary school foreign language classroom corpus and development of a CEFR-J compliant teaching method search tool
基于小学外语课堂语料库的教学效果验证及符合CEFR-J标准的教法检索工具开发
- 批准号:
23K00708 - 财政年份:2023
- 资助金额:
$ 80万 - 项目类别:
Grant-in-Aid for Scientific Research (C)