A UNIFIED MULTITASK ARCHITECTURE FOR PREDICTING LOCAL PROTEIN PROPERTIES

用于预测局部蛋白质特性的统一多任务架构

基本信息

  • 批准号:
    8365897
  • 负责人:
  • 金额:
    $ 2.14万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-09-01 至 2012-06-30
  • 项目状态:
    已结题

项目摘要

This subproject is one of many research subprojects utilizing the resources provided by a Center grant funded by NIH/NCRR. Primary support for the subproject and the subproject's principal investigator may have been provided by other sources, including other NIH sources. The Total Cost listed for the subproject likely represents the estimated amount of Center infrastructure utilized by the subproject, not direct funding provided by the NCRR grant to the subproject or subproject staff. A variety of functionally important protein properties, such as secondary structure, transmembrane topology and solvent accessibility, can be encoded as a labeling of amino acids. Indeed, the prediction of such properties from the primary amino acid sequence is one of the core projects of computational biology. Accordingly, a panoply of approaches have been developed for predicting such properties; however, most such approaches focus on solving a single task at a time. Motivated by recent, successful work in natural language processing, we propose to use multitask learning to train a single, joint model that exploits the dependencies among these various labeling tasks. We describe a deep neural network architecture that, given a protein sequence, outputs a host of predicted local properties, including secondary structure, solvent accessibility, transmembrane topology, signal peptides and DNA-binding residues. The network is trained jointly on all these tasks in a supervised fashion, augmented with a novel form of semi-supervised learning in which the model is trained to distinguish between local patterns from natural and synthetic protein sequences. The task-independent architecture of the network obviates the need for task-specific feature engineering. We demonstrate that, for all of the tasks that we considered, our approach leads to statistically significant improvements in performance, relative to a single task neural network approach, and that the resulting model achieves state-of-the-art performance.
这个子项目是许多利用资源的研究子项目之一 由NIH/NCRR资助的中心拨款提供。子项目的主要支持 而子项目的主要调查员可能是由其他来源提供的, 包括其它NIH来源。 列出的子项目总成本可能 代表子项目使用的中心基础设施的估计数量, 而不是由NCRR赠款提供给子项目或子项目工作人员的直接资金。 多种功能上重要的蛋白质特性,例如 二级结构、跨膜拓扑结构和溶剂可及性, 可以被编码为氨基酸的标记。 事实上, 一级氨基酸序列的这种性质是其中之一, 计算生物学的核心项目。 因此, 已经开发了用于预测这些性质的方法; 然而,大多数这样的方法集中在解决一个单一的任务, 时间 受最近自然语言方面成功工作的启发 处理,我们建议使用多任务学习来训练一个 一个单一的联合模型,利用这些不同的依赖关系, 标签任务。 我们描述了一个深度神经网络架构 给定一个蛋白质序列, 性质,包括二级结构,溶剂可及性, 跨膜拓扑结构、信号肽和DNA结合残基。 的 网络以监督的方式在所有这些任务上联合训练, 通过一种新型的半监督学习形式进行增强,其中 训练模型以区分局部模式和自然模式。 和合成蛋白质序列。的任务无关架构 该网络消除了对特定于任务的特征的需要 工程.我们证明,对于我们所做的所有任务, 考虑到,我们的方法导致统计显著 相对于单任务神经网络,性能的改进 方法,并且由此产生的模型实现了最先进的 性能

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

William Noble其他文献

William Noble的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('William Noble', 18)}}的其他基金

ON USING SAMPLES OF KNOWN PROTEIN CONTENT TO ASSESS THE STATISTICAL CALIBRATION
关于使用已知蛋白质含量的样品来评估统计校准
  • 批准号:
    8365887
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
LEARNING SPARSE MODELS FOR A DYNAMIC BAYESIAN NETWORK CLASSIFIER OF PROTEIN SECO
学习蛋白质 SECO 动态贝叶斯网络分类器的稀疏模型
  • 批准号:
    8365898
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
A DYNAMIC BAYESIAN NETWORK FOR IDENTIFYING PROTEIN BINDING FOOTPRINTS FROM SINGL
一种用于识别单个蛋白质结合足迹的动态贝叶斯网络
  • 批准号:
    8365880
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
COMPUTATIONAL CHARACTERIZATION OF HOMING ENDONUCLEASE BINDING SPECIFICITY
归巢核酸内切酶结合特异性的计算表征
  • 批准号:
    8365906
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
EFFICIENT MARGINALIZATION TO COMPUTE PROTEIN POSTERIOR PROBABILITIES FROM SHOTGU
通过 Shotgu 进行有效边缘化计算蛋白质后验概率
  • 批准号:
    8365888
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
PRECURSOR CHARGE STATE PREDICTION FOR ELECTRON TRANSFER DISSOCIATION TANDEM MASS
电子转移解离串联质量的前体电荷态预测
  • 批准号:
    8365872
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
SEMINARS GIVEN BY WILLIAM STAFFORD NOBLE
威廉·斯塔福德·诺布尔举办的研讨会
  • 批准号:
    8365905
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
SOFTWARE DISTRIBUTED BY THE NOBLE LAB, 2010-2011
NOBLE LAB 分发的软件,2010-2011 年
  • 批准号:
    8365904
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
KINDERGARTEN TOUR
幼儿园参观
  • 批准号:
    8365879
  • 财政年份:
    2011
  • 资助金额:
    $ 2.14万
  • 项目类别:
LARGE-SCALE PREDICTION OF PROTEIN-PROTEIN INTERACTIONS FROM STRUCTURE
从结构大规模预测蛋白质-蛋白质相互作用
  • 批准号:
    8171275
  • 财政年份:
    2010
  • 资助金额:
    $ 2.14万
  • 项目类别:

相似海外基金

Double Incorporation of Non-Canonical Amino Acids in an Animal and its Application for Precise and Independent Optical Control of Two Target Genes
动物体内非规范氨基酸的双重掺入及其在两个靶基因精确独立光学控制中的应用
  • 批准号:
    BB/Y006380/1
  • 财政年份:
    2024
  • 资助金额:
    $ 2.14万
  • 项目类别:
    Research Grant
Quantifying L-amino acids in Ryugu to constrain the source of L-amino acids in life on Earth
量化 Ryugu 中的 L-氨基酸以限制地球生命中 L-氨基酸的来源
  • 批准号:
    24K17112
  • 财政年份:
    2024
  • 资助金额:
    $ 2.14万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
Molecular recognition and enantioselective reaction of amino acids
氨基酸的分子识别和对映选择性反应
  • 批准号:
    23K04668
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Basic research toward therapeutic strategies for stress-induced chronic pain with non-natural amino acids
非天然氨基酸治疗应激性慢性疼痛策略的基础研究
  • 批准号:
    23K06918
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Molecular mechanisms how arrestins that modulate localization of glucose transporters are phosphorylated in response to amino acids
调节葡萄糖转运蛋白定位的抑制蛋白如何响应氨基酸而被磷酸化的分子机制
  • 批准号:
    23K05758
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Design and Synthesis of Fluorescent Amino Acids: Novel Tools for Biological Imaging
荧光氨基酸的设计与合成:生物成像的新工具
  • 批准号:
    2888395
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
    Studentship
Collaborative Research: RUI: Elucidating Design Rules for non-NRPS Incorporation of Amino Acids on Polyketide Scaffolds
合作研究:RUI:阐明聚酮化合物支架上非 NRPS 氨基酸掺入的设计规则
  • 批准号:
    2300890
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
    Continuing Grant
Structurally engineered N-acyl amino acids for the treatment of NASH
用于治疗 NASH 的结构工程 N-酰基氨基酸
  • 批准号:
    10761044
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
Lifestyle, branched-chain amino acids, and cardiovascular risk factors: a randomized trial
生活方式、支链氨基酸和心血管危险因素:一项随机试验
  • 批准号:
    10728925
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
Single-molecule protein sequencing by barcoding of N-terminal amino acids
通过 N 端氨基酸条形码进行单分子蛋白质测序
  • 批准号:
    10757309
  • 财政年份:
    2023
  • 资助金额:
    $ 2.14万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了