Machine learning approaches for improved accuracy and speed in sequence annotation

用于提高序列注释的准确性和速度的机器学习方法

基本信息

  • 批准号:
    10838066
  • 负责人:
  • 金额:
    $ 25.21万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-09-20 至 2024-07-31
  • 项目状态:
    已结题

项目摘要

Summary/Abstract Alignment of biological sequences is a key step in understanding their evolution, function, and patterns of activity. Here, we describe Machine Learning approaches to improve both accuracy and speed of highly- sensitive sequence alignment. To improve accuracy, we develop methods to reduce erroneous annotation caused by (1) the existence of low complexity and repetitive sequence and (2) the overextension of alignments of true homologs into unrelated sequence. We describe approaches based on both hidden Markov models and Artificial Neural Networks to dramatically reduce these sorts of sequence annotation error. We also address the issue of annotation speed, with development of a custom Deep Learning architecture designed to very quickly filter away large portions of candidate sequence comparisons prior to the relatively-slow sequence-alignment step. The results of these efforts will be incorporated into forks of the open source sequence alignment tools HMMER, MMSeqs, and (where appropriate) BLAST; we will also work with community developers of annotation pipelines, such as RepeatMasker and IMG/M, to incorporate these approaches. The development and incorporation into these widely used bioinformatics tools will lead to widespread impact on sequence annotation efforts.
总结/摘要 生物序列的比对是理解其进化、功能和生物学模式的关键步骤。 活动在这里,我们描述了机器学习方法,以提高准确性和速度的高度- 灵敏的序列比对为了提高准确性,我们开发了减少错误注释的方法 这是由于(1)存在低复杂性和重复序列,以及(2)过度延伸, 将真正的同源物排列成不相关的序列。我们描述的方法基于两个隐藏的 马尔可夫模型和人工神经网络,以显着减少这些类型的序列注释 错误.我们还解决了注释速度的问题,开发了一个自定义的深度学习 该架构被设计为在比较之前非常快速地过滤掉大部分候选序列比较。 相对缓慢的序列比对步骤。这些努力的成果将纳入《联合国宪章》的各分支, 开源序列比对工具HMMER、MMSeqs和(适当时)BLAST;我们还将 与注释管道的社区开发人员(如RepeatMasker和IMG/M)合作, 这些方法。开发和纳入这些广泛使用的生物信息学工具将导致 对序列注释工作的广泛影响。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Drugsniffer: An Open Source Workflow for Virtually Screening Billions of Molecules for Binding Affinity to Protein Targets.
  • DOI:
    10.3389/fphar.2022.874746
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    5.6
  • 作者:
    Venkatraman, Vishwesh;Colligan, Thomas H.;Lesica, George T.;Olson, Daniel R.;Gaiser, Jeremiah;Copeland, Conner J.;Wheeler, Travis J.;Roy, Amitava
  • 通讯作者:
    Roy, Amitava
nail: software for high-speed, high-sensitivity protein sequence annotation.
nail:用于高速、高灵敏度蛋白质序列注释的软件。
DISCO: A deep learning ensemble for uncertainty-aware segmentation of acoustic signals.
DISCO:一种深度学习集成,用于对声学信号进行不确定性感知分割。
  • DOI:
    10.1101/2023.01.24.525459
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Colligan,Thomas;Irish,Kayla;Emlen,DouglasJ;Wheeler,TravisJ
  • 通讯作者:
    Wheeler,TravisJ
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Travis John Wheeler其他文献

Travis John Wheeler的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Travis John Wheeler', 18)}}的其他基金

Building Knowledge About Alternatively-spliced Dual-Coding Exons
建立关于选择性剪接双编码外显子的知识
  • 批准号:
    10363514
  • 财政年份:
    2022
  • 资助金额:
    $ 25.21万
  • 项目类别:
Building Knowledge About Alternatively-spliced Dual-Coding Exons
建立关于选择性剪接双编码外显子的知识
  • 批准号:
    10701663
  • 财政年份:
    2022
  • 资助金额:
    $ 25.21万
  • 项目类别:
Machine learning approaches for improved accuracy and speed in sequence annotation: supplement for software enhancement
提高序列注释准确性和速度的机器学习方法:软件增强的补充
  • 批准号:
    10406630
  • 财政年份:
    2019
  • 资助金额:
    $ 25.21万
  • 项目类别:
Machine learning approaches for improved accuracy and speed in sequence annotation
用于提高序列注释的准确性和速度的机器学习方法
  • 批准号:
    10465048
  • 财政年份:
    2019
  • 资助金额:
    $ 25.21万
  • 项目类别:
Machine learning approaches for improved accuracy and speed in sequence annotation
用于提高序列注释的准确性和速度的机器学习方法
  • 批准号:
    10020995
  • 财政年份:
    2019
  • 资助金额:
    $ 25.21万
  • 项目类别:
Machine learning approaches for improved accuracy and speed in sequence annotation
用于提高序列注释的准确性和速度的机器学习方法
  • 批准号:
    10231149
  • 财政年份:
    2019
  • 资助金额:
    $ 25.21万
  • 项目类别:

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Understanding structural evolution of galaxies with machine learning
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
  • 批准号:
    62003314
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
  • 批准号:
    61902016
  • 批准年份:
    2019
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
儿童音乐能力发展对语言与社会认知能力及脑发育的影响
  • 批准号:
    31971003
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
  • 批准号:
    61806040
  • 批准年份:
    2018
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
  • 批准号:
    51769027
  • 批准年份:
    2017
  • 资助金额:
    38.0 万元
  • 项目类别:
    地区科学基金项目
多场景网络学习中基于行为-情感-主题联合建模的学习者兴趣挖掘关键技术研究
  • 批准号:
    61702207
  • 批准年份:
    2017
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于异构医学影像数据的深度挖掘技术及中枢神经系统重大疾病的精准预测
  • 批准号:
    61672236
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目

相似海外基金

Automating data acquisition and data processing pipeline via artificial intelligence and machine learning approaches to allow at-home use of a novel breast cancer screening method employing bra-based elastography imaging.
通过人工智能和机器学习方法自动化数据采集和数据处理流程,以便在家使用基于胸罩的弹性成像成像的新型乳腺癌筛查方法。
  • 批准号:
    486956
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Operating Grants
Developing machine learning based approaches to weld residual stress problems
开发基于机器学习的方法来解决焊接残余应力问题
  • 批准号:
    2894296
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Studentship
Determining the ototoxic potential of COVID-19 therapeutics using machine learning and in vivo approaches
使用机器学习和体内方法确定 COVID-19 疗法的耳毒性潜力
  • 批准号:
    10732745
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
Developing novel machine learning approaches to studying cell development
开发新的机器学习方法来研究细胞发育
  • 批准号:
    2326879
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Continuing Grant
Research Initiation Award: Uncovering and Extracting Biological Information from Nanopore Long-read Sequencing Data with Machine Learning and Mathematical Approaches
研究启动奖:利用机器学习和数学方法从纳米孔长读长测序数据中发现和提取生物信息
  • 批准号:
    2300445
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Standard Grant
Improving aerosol and spray process computation fluid dynamics models with machine learning approaches
利用机器学习方法改进气溶胶和喷雾过程计算流体动力学模型
  • 批准号:
    2881557
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Studentship
CAREER: Combining Machine Learning and Physics-based Modeling Approaches for Accelerating Scientific Discovery
职业:结合机器学习和基于物理的建模方法来加速科学发现
  • 批准号:
    2239175
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Continuing Grant
Target identification from multiomics data using systems biology and machine learning approaches
使用系统生物学和机器学习方法从多组学数据中识别目标
  • 批准号:
    BB/Y512734/1
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Training Grant
Constructing a Digital Twin for a self-correcting Scanning Transmission Electron Microscope using Machine Learning Approaches
使用机器学习方法构建自校正扫描透射电子显微镜的数字孪生
  • 批准号:
    2889721
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Studentship
Cheminformatics and Machine Learning approaches for GPCR Computer Aided Drug Design
GPCR 计算机辅助药物设计的化学信息学和机器学习方法
  • 批准号:
    BB/X511778/1
  • 财政年份:
    2023
  • 资助金额:
    $ 25.21万
  • 项目类别:
    Training Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了