Construction of a support vector machine (SVM) for accurately detecting domain boundaries

构建支持向量机(SVM)以准确检测域边界

基本信息

  • 批准号:
    18500225
  • 负责人:
  • 金额:
    $ 2.48万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2006
  • 资助国家:
    日本
  • 起止时间:
    2006 至 2007
  • 项目状态:
    已结题

项目摘要

The prediction of structural domains in novel protein sequences is becoming of practical importance. One important area of application is the development of computer-aided techniques for identifying, at a low cost, novel protein domain targets for large-scale functional and structural proteomics. Traditional computer-aided methods rely on sequence similarity to domain databases such as Pfam, Prosite or SMART. However, methods that work independently from domain databases are required for detecting novel domains. Such methods need to predict domain regions solely from the information contained in the amino acid sequence of the protein of interest. In this project, we report a Support Vector Machine (SVM) that identifies domain linkers, which are loops separating two structural domains. We constructed a multi-domain protein database based on SCOP and CATH domain boundary definition. First, we selected domains that do not form inter-domain interactions, as defined by the presence of inter-domain VdW, Hbonds and SS-bonds, and are independently foldable. From this set, we further selected domain boundaries that form loops as defined by DSSP. Domain boundaries that fulfilled both conditions were called linkers and used for training and testing the SVM.We developed a domain linker prediction (DLP-SVM) based on SVMlight. The sensitivity and the specificity were, respectively, 46.8% and 57.1%. These values are over 5.1 and 6.8%, respectively, higher than previously reported methods. DLP-SVM is freely available at : http://www.tuat.ac.jp/~ domserv/cgi-bin/DLP-SVM.cgiA travel grant from the Protein Science Society of Japan was awarded to PhD student Teippei Ebina for presenting this research at the PRICIPS 2008 conference held in Cairns, Australia, June 2008.
新型蛋白质序列中结构域的预测变得具有实际重要性。一个重要的应用领域是开发计算机辅助技术,以低成本识别大规模功能和结构蛋白质组学的新型蛋白质结构域靶标。传统的计算机辅助方法依赖于 Pfam、Prosite 或 SMART 等领域数据库的序列相似性。然而,检测新域需要独立于域数据库工作的方法。此类方法需要仅根据目标蛋白质的氨基酸序列中包含的信息来预测结构域区域。在这个项目中,我们报告了一个识别域链接器的支持向量机(SVM),域链接器是分隔两个结构域的循环。我们构建了基于SCOP和CATH域边界定义的多域蛋白质数据库。首先,我们选择了不形成域间相互作用的域,如域间 VdW、Hbonds 和 SS-bonds 的存在所定义的,并且是独立可折叠的。从这个集合中,我们进一步选择了形成 DSSP 定义的循环的域边界。满足这两个条件的域边界称为链接器,用于训练和测试SVM。我们开发了基于SVMlight的域链接器预测(DLP-SVM)。敏感性和特异性分别为 46.8% 和 57.1%。这些值分别比之前报道的方法高出 5.1% 和 6.8% 以上。 DLP-SVM 可在以下网址免费获取:http://www.tuat.ac.jp/~ domserv/cgi-bin/DLP-SVM.cgi 博士生 Teippei Ebina 获得日本蛋白质科学学会的旅费资助,以表彰其在 2008 年 6 月于澳大利亚凯恩斯举行的 PRICIPS 2008 会议上展示这项研究成果。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Accurate domain linker prediction by Support Vector Machine
通过支持向量机进行准确的域链接器预测
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.;Ebina;H.;Toh;Y.;Kuroda
  • 通讯作者:
    Kuroda
ASH structural alignment package: Sensitivity and selectivity in domain classification
ASH 结构对齐包:域分类中的敏感性和选择性
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Standley D. M.;Toh H.;Nakamura H.
  • 通讯作者:
    Nakamura H.
Functional annotation by sequence-weighted structure alignments: Statistical analysis and case studies from the Protein 3000 structural genomics project in Japan
通过序列加权结构比对进行功能注释:日本 Protein 3000 结构基因组项目的统计分析和案例研究
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Standley;DM.;Toh;H.;Nakamura;H.
  • 通讯作者:
    H.
Sarbolouki M.N.,Structural and functional characterization of a mutant of Pseudocerastes persicus natriuretic peptide
Sarbolouki M.N.,Pseudocerastes persicus 利钠肽突变体的结构和功能表征
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Maryam M.E.;Amininasab M.;Hondo T.;Kikuchi J.;Kuroda Y.;Naderi-Manesh H.
  • 通讯作者:
    Naderi-Manesh H.
MDシミュレーションを用いたGFP変異体のトラジェクトリ解析
使用 MD 模拟对 GFP 突变体进行轨迹分析
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林貴幸;宮田裕介;養王田正文;黒田裕
  • 通讯作者:
    黒田裕
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

KURODA Yutaka其他文献

KURODA Yutaka的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('KURODA Yutaka', 18)}}的其他基金

Novel screening protocol for multi-SS bond proteins using SEP tags and its application to the development of a minimal Luciferase
使用 SEP 标签的多 SS 键蛋白的新型筛选方案及其在最小荧光素酶开发中的应用
  • 批准号:
    23651213
  • 财政年份:
    2011
  • 资助金额:
    $ 2.48万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Development of a novel amino acid solubility propensity scale for the calculation of polypeptide solubility
开发用于计算多肽溶解度的新型氨基酸溶解度倾向量表
  • 批准号:
    21300110
  • 财政年份:
    2009
  • 资助金额:
    $ 2.48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Construction of a neural network for detecting novel domains from amino acid sequence information only
构建仅从氨基酸序列信息检测新结构域的神经网络
  • 批准号:
    16500189
  • 财政年份:
    2004
  • 资助金额:
    $ 2.48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了