ゲノムデータベースからの相関ルール発見に関する研究
基因组数据库关联规则发现研究
基本信息
- 批准号:08780331
- 负责人:
- 金额:$ 0.64万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
分子生物学の実験データを格納したゲノムデータベースは指数関数的に増大し続けてる。ゲノムデータの中で主要なものは、タンパク質と核酸とについての配列情報/立体構造情報/機能情報である。これら3種の情報は互いに関連しており、一般に配列が定まれば構造が定まり、構造が定まれば発現する機能が定まる、と言われている。しかし、これら配列/構造/機能間の対応がどのような法則に支配されているかは部分的にしかわかっていない。本研究では、データベース研究の分野で注目されているデータマイニング手法のうち、Agrawalらが1993年に開発した相関ルール発見手法を、始めてゲノムデータベースからの知識発見に応用した。まず、Agrawalらの手法をHoutsmaらが改良したアルゴリズムSETMをワークステーション上で実装し、次に、PDB,SWISS-PROT,PROSITEといったタンパク質関連の公的データベースをもとにデータマイニング用の実験データを生成し、これを用いて知識発見の実験を行なった。その結果、セリンエンドペプチダーゼおよびアスパラギン酸エンドペプチダーゼという2種類の酵素群について、配列情報/立体構造情報/機能情報の間に強い相関関係があることを、相関ルールの形で発見した。また、否定情報を扱えるよう相関ルール発見の枠組を拡張することを検討した。その結果、単純な手法で(つまり、ある命題が「成立しない」という否定的な命題をマイニング用のデータに追加する方法で)否定情報を含むルールを発見できることが分かった。しかし、この方法をそのまま用いるとあまり意味のないルールが大量に生成されるため、最大サポートによる枝刈りや、否定情報のみから成るルールを生成しないなどの処理が有効であることが分かった。相関ルール発見の枠組を述語論理形式に拡張する研究については、基本アルゴリズムの開発を終えて現在ワークステーション上で実装中であるため、実際にゲノムデータに応用する所までには至らなかった。
Molecular biology is the most important part of the study. The main information in the list is the sequence information/three-dimensional structure information/functional information. These three kinds of information are interrelated, generally arranged, structured, and realized. The law governing the arrangement/construction/function of the structure is that it is not necessary for the structure/function of the structure. This study focuses on the development and application of knowledge in the field of research. Agrawal developed the related research methods in 1993. Houtsma, Agrawal's approach to improving SETM,SWISS-PROT,PROSITE and the quality of the public's data, such as SETM, PDB,PROSITE and the quality of the public's data, is used to generate and use knowledge. As a result, there is a strong correlation between the two types of enzyme groups, the arrangement information/the three-dimensional structure information/the function information, and the shape of the correlation group. The information is not available. The information is not available. The result is pure and simple.( This means that a lot of information is generated, maximum information is generated, and negative information is generated. The research on the logical form of the relevant group of statements is carried out in the following ways: first, the basic theory of the development of the system; second, the practical theory of the system;
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Kenji Satou 他6名: "Finding Association Rules on Heterogeneous Genome Data" Proceeding of Pacific Symposium on Biocomputing '97 (PSB'97). 397-408 (1997)
Kenji Satou 和其他 6 人:“寻找异质基因组数据的关联规则”太平洋生物计算研讨会 97 论文集 (PSB97) (1997)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
佐藤 賢二其他文献
佐藤 賢二的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('佐藤 賢二', 18)}}的其他基金
ゲノムデータベースからの網羅的データマイニングに関する研究
基因组数据库综合数据挖掘研究
- 批准号:
09780314 - 财政年份:1997
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
演繹データベースにおける類似解検索手法に関する研究
演绎数据库中相似解搜索方法研究
- 批准号:
05780297 - 财政年份:1993
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)