Transmembrane Protein Segment Prediction and Understanding based on Machine Learning Methods

基于机器学习方法的跨膜蛋白片段预测与理解

基本信息

项目摘要

In recent years, there have been many studies focusing on improving the accuracy of prediction of transmembrane segments, and many significant results have been achieved. In spite of these considerable results, the existing methods lack the ability to explain the process of how a learning result is reached and why a prediction decision is made. The explanation of a decision made is important for the acceptance of machine learning technology in bioinformatics applications such as protein structure prediction. While support vector machines (SVM) have shown strong generalization ability in a number of application areas, including protein structure prediction, they are black box models and hard to understand. In our current NSF project (CCR 0514750), rough sets data analysis has been proposed for data mining. In this project, we propose to extend our results in data mining from the current NSF project to bioinformatics. In particular, we propose to use an innovative approach to rule generation for understanding prediction of transmembranesegments by integrating the merits of rough set theory, SVMs and association rule based classifiers. We believe that the new approach can be used not only for transmembrane segments prediction, but also for understanding the prediction. The prediction and its interpretation obtained can be used for guiding biological experiments.Intellectual Merits: The focus of this proposal is to combine rough set theory from our current NSF project, SVMs and association rule based classifiers to elucidate a new approach for transmembrane segments prediction and its understanding. While there exist several methods for the same purpose, the proposal seeks to achieve better performance with respect to accuracy and the number of generated patterns. It is hoped that the patterns generated can be easily understandable and biologically meaningful and can be used by biologists to guide their experiments. This collaborative approach draws upon the strengths of the PI in machine learning and the co-PI's expertise in transmembrane to validate our new method. The resulting softwarewill not only be able to predict transmembrane segments, but moreover how the prediction is achieved.Broader Impacts: While the focus of the this proposal is on transmembrane segments prediction and its understanding, it must be emphasized that the new approach and the software tools developed are completely generalizable and can be applied to other domains such as protein secondary structure prediction. The collaborators believe the process described in this proposal is as important as the end product as the proposal is inherently collaborative and cross-disciplinary. As such, the proposal lends itself immediately as a jumping point for increasing the interaction between computer scientists and biologists, important not only as part of modern research approaches to tackling difficult problems in cell biology and complex systems but in exposing students and researchers to both the cutting edge research and problems that are manifest in eachof our respective fields.
近年来,人们围绕提高跨膜片段预测的准确性展开了大量研究,并取得了许多有意义的成果。尽管有这些可观的结果,现有的方法缺乏解释学习结果如何达到以及为什么做出预测决策的过程的能力。对所做决策的解释对于机器学习技术在生物信息学应用中的接受是重要的,例如蛋白质结构预测。虽然支持向量机(SVM)在包括蛋白质结构预测在内的许多应用领域都表现出很强的泛化能力,但它们是黑箱模型,难以理解。在我们目前的NSF项目(CCR 0514750),粗糙集数据分析已被提出的数据挖掘。在这个项目中,我们建议将我们的结果从目前的NSF项目数据挖掘生物信息学。特别是,我们建议使用一种创新的方法来理解transmembranesegments预测的规则生成集成粗糙集理论,支持向量机和基于关联规则的分类器的优点。我们相信,新的方法不仅可以用于跨膜片段的预测,但也为理解预测。预测和它的解释,可以用来指导生物实验。智能优点:这个建议的重点是结合联合收割机粗糙集理论,从我们目前的NSF项目,支持向量机和关联规则为基础的分类器,阐明一个新的跨膜段预测和理解的方法。虽然存在用于相同目的的几种方法,但该提案寻求在准确性和生成的模式的数量方面实现更好的性能。人们希望生成的模式可以很容易地理解和生物学意义,并可以被生物学家用来指导他们的实验。这种协作方法利用PI在机器学习方面的优势和co-PI在跨膜方面的专业知识来验证我们的新方法。由此产生的软件将不仅能够预测跨膜片段,而且预测是如何实现的。更广泛的影响:虽然这个建议的重点是跨膜片段的预测和理解,但必须强调的是,新的方法和开发的软件工具是完全通用的,可以应用于其他领域,如蛋白质二级结构预测。合作者认为,本提案中描述的过程与最终产品一样重要,因为提案本身就是协作和跨学科的。因此,该提案立即成为增加计算机科学家和生物学家之间互动的一个跳跃点,不仅作为解决细胞生物学和复杂系统中难题的现代研究方法的一部分,而且还使学生和研究人员接触到我们各自领域的前沿研究和问题。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Yi Pan其他文献

Development of touch sensor with optical positional sensor
开发带有光学位置传感器的触摸传感器
A self-assembled bisoxazoline/Pd composite microsphere as an excellent catalyst for Suzuki–Miyaura coupling reactions
自组装双恶唑啉/Pd复合微球作为铃木-宫浦偶联反应的优异催化剂
  • DOI:
    10.1039/c5gc01551k
  • 发表时间:
    2016-02
  • 期刊:
  • 影响因子:
    9.8
  • 作者:
    Junke Wang;Yingxiao Zong;Xicun Wang;Yulai Hu;Guoren Yue;Yi Pan
  • 通讯作者:
    Yi Pan
Estimating Typhoon Waves based on the Modified ECMWF ERA-5 Wind Data
基于修改后的 ECMWF ERA-5 风数据估算台风波
  • DOI:
    10.2112/si95-228.1
  • 发表时间:
    2020-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiangxia Li;Yi Pan;Yongping Chen;Shunqi Pan
  • 通讯作者:
    Shunqi Pan
Novel cryopreservation medium for enhanced stability of T cells at −80°C
新型冷冻保存介质可增强 T 细胞在 -80°C 下的稳定性
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    WenXuan Zhou;Chen Wang;Yao Shi;Yi Pan;XiaDuo Meng;XunLei Kang;Xu Han
  • 通讯作者:
    Xu Han
Examining Graph Properties of Unstructured Peer-to-Peer Overlay Topology
检查非结构化点对点覆盖拓扑的图属性

Yi Pan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Yi Pan', 18)}}的其他基金

Collaborative Research: Real World Relevant Security Labware for Mobile Threat Analysis and Protection Experience
协作研究:用于移动威胁分析和保护体验的现实世界相关安全实验室软件
  • 批准号:
    1244665
  • 财政年份:
    2013
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Capacity Building: Collaborative Research: Integrated Learning Environment for Cyber Security of Smart Grid
能力建设:协作研究:智能电网网络安全的集成学习环境
  • 批准号:
    1303359
  • 财政年份:
    2013
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Travel Awards for The 2011 IEEE International Conference on Bioinformatics & Biomedicine
2011 年 IEEE 国际生物信息学会议旅行奖
  • 批准号:
    1142717
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
(NECO) Collaborative Research: Reliability Modeling for Large-Scale Networking System (LSNS), and Self-Improvement in LSNS
(NECO) 合作研究:大规模网络系统 (LSNS) 的可靠性建模以及 LSNS 的自我改进
  • 批准号:
    0831634
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
High Performance Rough Sets Data Analysis in Data Mining
数据挖掘中的高性能粗糙集数据分析
  • 批准号:
    0514750
  • 财政年份:
    2005
  • 资助金额:
    --
  • 项目类别:
    Standard Grant

相似国自然基金

有翅与无翅蚜虫差异分泌唾液蛋白Cuticular protein在调控植物细胞壁免疫中的功能
  • 批准号:
    32372636
  • 批准年份:
    2023
  • 资助金额:
    50.00 万元
  • 项目类别:
    面上项目
抑制Protein Kinase D促进胚胎干细胞自我更新的分子机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    54 万元
  • 项目类别:
    面上项目
C2 DOMAIN PROTEIN 1 (C2DP1)基因家族在植物开花调控中的功能研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
凡纳滨对虾Laccase-like protein非酶活依赖参与抗WSSV免疫的分子机制
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
帽结合蛋白(cap binding protein)调控乙烯信号转导的分子机制
  • 批准号:
    32170319
  • 批准年份:
    2021
  • 资助金额:
    58.00 万元
  • 项目类别:
    面上项目
帽结合蛋白(cap binding protein)调控乙烯信号转导的分子机制
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    58 万元
  • 项目类别:
玉米基因Dirigent protein 4的克隆和功能鉴定
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
C1q/TNF-related protein 9调控平滑肌细胞程序性坏死抑制动脉粥样硬化的机制研究
  • 批准号:
    81900309
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Sustaining chicken-meat production with alternative protein sources
利用替代蛋白质来源维持鸡肉生产
  • 批准号:
    LP220100292
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Linkage Projects
New substrates and functions for the DYRK protein kinases
DYRK 蛋白激酶的新底物和功能
  • 批准号:
    2894877
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Studentship
Optimal cell factories for membrane protein production
用于膜蛋白生产的最佳细胞工厂
  • 批准号:
    BB/Y007603/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Research Grant
New substrates and functions for the DYRK protein kinases
DYRK 蛋白激酶的新底物和功能
  • 批准号:
    BB/Y512527/1
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Training Grant
CAREER: atomistic characterization of protein-polymer conjugates
职业:蛋白质-聚合物缀合物的原子表征
  • 批准号:
    2339330
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Continuing Grant
Conference: 2024 Protein Processing, Trafficking and Secretion GRC/GRS
会议:2024 蛋白质加工、运输和分泌 GRC/GRS
  • 批准号:
    2419301
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
I-Corps: Translation Potential of a High Throughput Drug Discovery Platform for Protein Degraders
I-Corps:蛋白质降解剂高通量药物发现平台的转化潜力
  • 批准号:
    2419488
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
ミトコンドリアUnCoupling Protein 2による出血性ショック予後改善効果
线粒体解偶联蛋白2对改善失血性休克预后的影响
  • 批准号:
    24K12175
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Intelligent cryo-electron microscopy of G protein-coupled receptors
G 蛋白偶联受体的智能冷冻电子显微镜
  • 批准号:
    23K23818
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Examining the Function of a Novel Protein in the Cardiac Junctional Membrane Complex
检查心脏连接膜复合体中新型蛋白质的功能
  • 批准号:
    10749672
  • 财政年份:
    2024
  • 资助金额:
    --
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了