Algorithms for Extraction of Common Patterns from Data in Bioinformatics
从生物信息学数据中提取常见模式的算法
基本信息
- 批准号:13680394
- 负责人:
- 金额:$ 1.66万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 2003
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
We studied algorithms for extracting common patterns from biological data such as DNA sequences, protein structures, two-dimensional electrophoresis image and gene expression data. We mainly obtained the following results.1.Extraction of Common Patterns by Local Alignment. The Gibbs sampling algorithm is widely-used for extraction of common patterns from sequence data. We developed a variant of the Gibbs sampling algorithm, which can be applied to numerical sequences. We applied the developed algorithm to detection of motifs from protein structures.2.On the Complexity of Deriving Patterns from Positive and Negative Sequences. We studied theoretical aspects of deriving position specific score matrices (PSSM) from positive and negative sequences.3.Pattern Matching Algorithms for Electrophoresis Image Data and Protein Structures. We formulated a pattern matching problem for 2-dimensional electrophoresis image data as a geometric matching problems and proved that it is NP-hard. On the other hand, we developed practical algorithms for computing optimal matchings for electrophoresis image data analysis and protein structure alignment.4.Kernel Method for Protein Sequence Classification. We developed a new kernel function for protein sequences based on the well-known local alignment algorithm for protein sequences. The kernel was combined with the support vector machine and was tested using some benchmark data. The results show that the new kernel is better than existing kernels.5.Inference of Protein-Protein Interactions Using Linear Programming. We developed a new method for inference of probabilities of domain-domain interactions from experimental data by formulating the inference problem as a linear program. The method was applied to inference of protein-protein interactions and was compared with existing methods. The results show that the proposed method outperforms existing methods for numerical data.
我们研究了从DNA序列、蛋白质结构、双向电泳图和基因表达数据等生物数据中提取常见模式的算法。我们主要取得了以下结果:1.基于局部比对的常见模式提取方法。Gibbs采样算法被广泛用于从序列数据中提取常见模式。我们开发了Gibbs抽样算法的一个变体,该算法可以应用于数字序列。将该算法应用于蛋白质结构中基序的检测。2.正负序列模式提取的复杂性。研究了从正负序列中提取位置特定的分数矩阵(PSSM)的理论问题。3.基于蛋白质结构和蛋白质结构的模式匹配算法。将二维电泳图像数据的模式匹配问题转化为几何匹配问题,并证明了该问题是NP难的。另一方面,针对电泳图数据分析和蛋白质结构比对,提出了计算最优匹配的实用算法。4.蛋白质序列分类的核方法。在著名的蛋白质序列局部比对算法的基础上,提出了一种新的蛋白质序列核函数。将该核函数与支持向量机相结合,并用一些基准数据进行了测试。实验结果表明,新的核函数优于已有的核函数。5.基于线性规划的蛋白质-蛋白质相互作用推理。通过将推理问题描述为线性规划,我们发展了一种新的方法来从实验数据推断域-域相互作用的概率。将该方法应用于蛋白质-蛋白质相互作用的推断,并与现有方法进行了比较。结果表明,该方法优于已有的数值数据处理方法。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
T.Akutsu, K.Kanaya, A.Ohyama, A.Fujiyama: "Point matching under non-uniform distortions"Discrete Applied Mathematics. 127. 5-21 (2003)
T.Akutsu、K.Kanaya、A.Ohyama、A.Fujiyama:“非均匀扭曲下的点匹配”离散应用数学。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
A local search algorithm for local multiple alignment : special case analysis and application to cancer classification
局部多重比对的局部搜索算法:特例分析及其在癌症分类中的应用
- DOI:
- 发表时间:2001
- 期刊:
- 影响因子:0
- 作者:T.Akutsu;S.Ott;T.Akutsu
- 通讯作者:T.Akutsu
Inferring a union of halfspaces from examples
从示例中推断半空间的并集
- DOI:
- 发表时间:2002
- 期刊:
- 影响因子:0
- 作者:T.Akutsu;S.Ott
- 通讯作者:S.Ott
遺伝子発現情報解析のための数理モデルとアルゴリズム
基因表达信息分析的数学模型和算法
- DOI:
- 发表时间:2003
- 期刊:
- 影响因子:0
- 作者:T.Akutsu;S.Ott;T.Akutsu;阿久津達也
- 通讯作者:阿久津達也
T.Akutsu, H.Bannai, S.Miyano, S.Ott: "On the complexity of deriving position specific score matrices from examples"Lecture Notes in Computer Science. 2373. 168-177 (2002)
T.Akutsu、H.Bannai、S.Miyano、S.Ott:“论从示例中导出位置特定分数矩阵的复杂性”计算机科学讲义。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
AKUTSU Tatsuya其他文献
機械学習QSARの整数計画法に基づく逆解析法
基于整数规划的机器学习QSAR逆分析方法
- DOI:
10.2477/jccj.2021-0030 - 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
NAGAMOCHI Hiroshi;ZHU Jianshen;AZAM Naveed Ahmed;HARAGUCHI Kazuya;ZHAO Liang;AKUTSU Tatsuya - 通讯作者:
AKUTSU Tatsuya
AKUTSU Tatsuya的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('AKUTSU Tatsuya', 18)}}的其他基金
An Approach to Novel Structure Design by Combining Discrete Methods and Statistical Methods
离散方法与统计方法相结合的新型结构设计方法
- 批准号:
26240034 - 财政年份:2014
- 资助金额:
$ 1.66万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Discrete Model-Based Methods for Control of Complex BiologicalSyetems
基于离散模型的复杂生物系统控制方法
- 批准号:
22650045 - 财政年份:2010
- 资助金额:
$ 1.66万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
An Approach to Novel Structural Design by Combining Discrete Methods and Kernel Methods
离散方法与核方法相结合的新型结构设计方法
- 批准号:
22240009 - 财政年份:2010
- 资助金额:
$ 1.66万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
New Methods for Designing Chemical Structures Using Graph Theory and Kernel Methods
使用图论和核方法设计化学结构的新方法
- 批准号:
19200022 - 财政年份:2007
- 资助金额:
$ 1.66万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Analysis of Structure and Dynamics of Biological Information Networks
生物信息网络的结构与动态分析
- 批准号:
17017019 - 财政年份:2005
- 资助金额:
$ 1.66万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
SHF: Medium: Efficient and Scalable Pattern Matching via Hardware-Software Co-Design
SHF:中:通过软硬件协同设计实现高效且可扩展的模式匹配
- 批准号:
2313062 - 财政年份:2023
- 资助金额:
$ 1.66万 - 项目类别:
Continuing Grant
Comprehensive Evaluation of Algorithms for Indeterminate Pattern-Matching
不确定模式匹配算法的综合评价
- 批准号:
569128-2022 - 财政年份:2022
- 资助金额:
$ 1.66万 - 项目类别:
Postgraduate Scholarships - Doctoral
Faster Run-Length Compressed String Indexing for Pattern Matching
用于模式匹配的更快的运行长度压缩字符串索引
- 批准号:
575477-2022 - 财政年份:2022
- 资助金额:
$ 1.66万 - 项目类别:
Alexander Graham Bell Canada Graduate Scholarships - Master's
Development of optimal time-space algorithms on pattern matching problems
模式匹配问题的最优时空算法的发展
- 批准号:
19K20208 - 财政年份:2019
- 资助金额:
$ 1.66万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Event Detection Platform (using pattern matching analytics)
事件检测平台(使用模式匹配分析)
- 批准号:
720636 - 财政年份:2015
- 资助金额:
$ 1.66万 - 项目类别:
GRD Development of Prototype
View-based processing of pattern matching queries in large graphs
大图中模式匹配查询的基于视图的处理
- 批准号:
DP130103051 - 财政年份:2013
- 资助金额:
$ 1.66万 - 项目类别:
Discovery Projects
Pattern matching algorithms for streaming data
流数据的模式匹配算法
- 批准号:
EP/H028056/2 - 财政年份:2013
- 资助金额:
$ 1.66万 - 项目类别:
Fellowship
Dynamic pattern matching: Faster Algorithms and New Bounds
动态模式匹配:更快的算法和新界限
- 批准号:
EP/J011940/1 - 财政年份:2012
- 资助金额:
$ 1.66万 - 项目类别:
Research Grant
AF: III: Small: Space-efficient Frameworks for Multi-pattern Matching in Text Streams
AF:III:小型:文本流中多模式匹配的空间高效框架
- 批准号:
1218904 - 财政年份:2012
- 资助金额:
$ 1.66万 - 项目类别:
Standard Grant














{{item.name}}会员




