Prediction and analysis of intrinsically disordered regions in membrane proteins

膜蛋白本质无序区域的预测和分析

基本信息

  • 批准号:
    17F17050
  • 负责人:
  • 金额:
    $ 1.41万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2017
  • 资助国家:
    日本
  • 起止时间:
    2017-10-13 至 2020-03-31
  • 项目状态:
    已结题

项目摘要

MoRFs(molecular recognition features)は、他分子との結合により、天然変性状態から非天然変性状態に遷移する領域で、細胞の分子相互作用ネットワークにおいて重要な役割を果たし、多くのヒトの疾患に関与する天然変性タンパク質(IDP)の重要な機能領域である。MoRFsの予測の大きな問題は、「明確な配列特徴がない」という点で、これに対しては、アミノ酸残基の特性に対して因子分析を適用するなど、特徴量の設計を工夫し、さらに深層学習を適用することで高感度の特徴の検出と高い予測精度の達成を目指した。我々は、まず、深層学習のCNN(convolutional neural network)を用いて、天然変性領域のアミノ酸配列からMoRFsを同定するシステムを開発した。学習する特徴量としては、PSSMと13種のAA Indexを用いた。MoRFsを含む421チェインと負例データからデータセットに対してAUC値で0.778という、従来のシステムより高い予測結果を得た。次に、集団学習を用いてMoRFsの予測精度のさらなる向上を図った。2つのCNNによる予測器(一つは、PSSMと22種の残基属性、もう一つは、PSSMと13種のAA indexを特徴量とする)、1次元CNNによる予測器とSVMによる予測器をあわせた4つの予測器による集団学習を行った。各予測器の結果は平均化によって集約した。特徴量は、どちらもPSSMと13種のAA indexを採用した。45個のMoRFsを含むテストデータセットと、膜タンパク質から生成した49個のMoRFsを含むテストデータセットを使用し性能評価を行ったところ、それぞれ、AUC値で0.795、0.776という結果であった。これらはどちらも、従来の手法に比べ、高い予測精度を達成している。本研究で開発したシステムは、Webで公開している。
MoRFs (molecular recognition features) are important functional domains related to the binding of other molecules, migration from natural to unnatural states, and molecular interactions between cells. The large problem of prediction of MoRFs is that the characteristics of specific allocation are not suitable for factor analysis. The design time of characteristics is not suitable for deep learning. The detection of characteristics with high sensitivity and the achievement of high prediction accuracy are indicated. The application of continuous neural network (CNN) in deep learning, the development of dynamic network in natural domain, and the coordination of MoRFs Learning characteristics and PSSM 13 AA Index MoRFs include 421 The accuracy of MoRFs prediction can be improved by group learning. 2. CNN-based sensors (22 residue attributes, 13 AA indexes), 1-dimensional CNN-based sensors, SVM-based sensors, 4-based sensors, set learning. The results of each predictor are averaged and concentrated. PSSM has 13 different AA indexes. 45 MoRFs were generated, 49 MoRFs were used, and AUC values were 0.795 and 0.776. The accuracy of this method is higher than that of the previous method. This study is open to the public.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Identifying MoRFs in Disordered Protein Using Enlarged Conserved Features
使用扩大的保守特征识别无序蛋白质中的 MoRF
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

清水 謙多郎其他文献

次世代シーケンサーデータの解析手法 第20回 RNA-seqカウントデータの性質と統計モデル
下一代测序仪数据的分析方法第20部分:RNA-seq计数数据的属性和统计模型
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 磨音;坂本光央;清水 謙多郎;門田 幸二
  • 通讯作者:
    門田 幸二
次世代シーケンサーデータの解析手法 第 11 回 統合データ解析環境 Galaxy
下一代测序仪数据分析方法 第11部分 集成数据分析环境 Galaxy
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    達郎 大田;朋子 寺田;清水 謙多郎;幸二 門田
  • 通讯作者:
    幸二 門田
Haplotype exhaustive prediction of SRK/SP11 complex structure in Brassicaceae using a modified MSA
使用改进的 MSA 对十字花科 SRK/SP11 复合结构进行单倍型详尽预测
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    澤 知希;森脇 由隆;寺田 透;村瀬 浩司;高山 誠司;清水 謙多郎
  • 通讯作者:
    清水 謙多郎
黄色ブドウ球菌のIsd-NEATドメイン間におけるヘム輸送についての考察
金黄色葡萄球菌 Isd-NEAT 结构域之间血红素运输的考虑
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森脇 由隆;寺田 透;Jose M. M. Caaveiro;津本 浩平;清水 謙多郎;Yoshitaka Moriwaki;森脇 由隆
  • 通讯作者:
    森脇 由隆
次世代シーケンサーデータの解析手法 第19回 R Markdown
新一代测序仪数据分析方法19th R Markdown
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧野 磨音;清水 謙多郎;門田 幸二
  • 通讯作者:
    門田 幸二

清水 謙多郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('清水 謙多郎', 18)}}的其他基金

Docking prediction and design of peptides by molecluar simulation and deep learning
通过分子模拟和深度学习进行肽的对接预测和设计
  • 批准号:
    21K12122
  • 财政年份:
    2021
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
タンパク質間相互作用部位予測手法の開発
蛋白质-蛋白质相互作用位点预测方法的发展
  • 批准号:
    07F07417
  • 财政年份:
    2007
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高精度のドッキング機能を有するタンパク質間相互作用予測システムの開発
开发具有高精度对接功能的蛋白质-蛋白质相互作用预测系统
  • 批准号:
    18016007
  • 财政年份:
    2006
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高精度のドッキング機能を有するタンパク質間相互作用予測システムの開発
开发具有高精度对接功能的蛋白质-蛋白质相互作用预测系统
  • 批准号:
    17017014
  • 财政年份:
    2005
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの真に透過で効率的な共有を実現する分散共有配列システムの開発
开发分布式共享阵列系统,实现大规模分布式数据真正透明高效共享
  • 批准号:
    16016226
  • 财政年份:
    2004
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ホモロジーモデリングとアビニシオ法の統合による高精度タンパク質構造予測手法の開発
结合同源建模和阿比尼西奥方法开发高精度蛋白质结构预测方法
  • 批准号:
    16014204
  • 财政年份:
    2004
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ホモロジーモデリングとアビニシオ法の統合による高精度タンパク質構造予測手法の開発
结合同源建模和阿比尼西奥方法开发高精度蛋白质结构预测方法
  • 批准号:
    15014207
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの効率的な共有を実現する並列コンピューティング環境の開発
开发实现大规模分布式数据高效共享的并行计算环境
  • 批准号:
    15017228
  • 财政年份:
    2003
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模分散データの効率的な共有を実現する並列コンピューティング環境の開発
开发实现大规模分布式数据高效共享的并行计算环境
  • 批准号:
    14019029
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
タンパク質の局所構造情報を利用したab initio立体構造・機能予測手法の開発
利用蛋白质局部结构信息开发从头算三维结构/功能预测方法
  • 批准号:
    14015208
  • 财政年份:
    2002
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas

相似海外基金

ステント再狭窄における炎症と糖タンパク質Fibulin-1の動的機能と役割
炎症和糖蛋白Fibulin-1在支架再狭窄中的动态功能和作用
  • 批准号:
    24K12141
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
糖鎖・糖タンパク質を利用した歯性感染症の分子イメージング技術の開発
利用糖链和糖蛋白开发牙科感染分子成像技术
  • 批准号:
    24K13128
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
標的細胞選択的に細胞質へmRNAを送達するタンパク質カプセルの開発
开发选择性将 mRNA 递送至靶细胞细胞质的蛋白质胶囊
  • 批准号:
    24KJ1042
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
温泉生物の比較ゲノム・タンパク質機能解析による温度適応に係る普遍的要素の探索
通过温泉生物比较基因组和蛋白质功能分析寻找与温度适应相关的普遍元素
  • 批准号:
    24KJ1741
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
タンパク質構成全キラルアミノ酸の三次元HPLC分析法開発と網羅的疾患マーカー探索
构建蛋白质全手性氨基酸三维HPLC分析方法并全面寻找疾病标志物
  • 批准号:
    24KJ1800
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フェロモンセラピー技術の開発に向けた魚類初のタンパク質系フェロモンの同定
鉴定鱼类中第一个基于蛋白质的信息素,用于开发信息素治疗技术
  • 批准号:
    24KJ1822
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
低分子量Gタンパク質のユビキチン化を介したエクソソーム分泌の新機構
通过低分子量 G 蛋白泛素化分泌外泌体的新机制
  • 批准号:
    24KJ1860
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
タンパク質分解機能低下による奇形精子形成メカニズムの解明
阐明蛋白水解功能下降导致畸形精子形成的机制
  • 批准号:
    24K12611
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
コメのタンパク質栄養強化・省肥料栽培を実現する新規遺伝子の解明
阐明可实现水稻蛋白质富集和节肥栽培的新基因
  • 批准号:
    24K08854
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
HIV2エンベロープ糖タンパク質の中和抗体誘導機構
HIV2包膜糖蛋白中和抗体诱导机制
  • 批准号:
    24K09337
  • 财政年份:
    2024
  • 资助金额:
    $ 1.41万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了