ゲノムデータベースからの網羅的データマイニングに関する研究

基因组数据库综合数据挖掘研究

基本信息

项目摘要

指数関数的に増大し続けるゲノムデータベースから自動的に有用な知識を発見することの重要性が近年指摘されている。これに対し筆者らはデータベース研究の分野で注目されているデータマイニング手法を用いた知識発見について研究を行なっている。しかし、大量かつ多種多様なゲノムデータベースか網羅的に知識発見を行なうためには、知識発見のエンジンと各種のデノム解析ソフトウェアをどのように相関ルール発見システムに統合していくかが大きな問題である。本年度は、前年度に開発したプロトタイプの改良を行なった。まず、可視化モジュール(PDB high-light)を改良することにより、類似構造検索モジュール(PACADE)およびデータマイニングモジュールからの呼出機構を強化し、さらに外部のゲノム解析プログラム(例えばFASTAなどのホモロジー検索)からも容易に呼び出せるような汎用的なパラメータ受渡しを行なうモジュールとしてPDB hige-lightを再実装した。また、可視化結果をもとに外部の解析/検索システムを容易に呼び出せる機能を付加した。これにより、ゲノムネット(http://www.genome.ad.jp/)が保有する各種ゲノムデータベースとの連係が容易になり、日々更新されるデータに対して検索/可視可/マイニングの3つを有機的に結びつけたサービスを構築できた。現在この統合サービス(WebPACADE)は、ゲノムネット上でWWWを通して公開され、利用されている。WebPACADEのデータマイニングモジュールは主に蛋白質関連の知識発見を行なうが、このモジュールを元に、ゲノムネット上の20種におよぶ各種ゲノムデータを組み合せて網羅的に知識発見を行なうモジュールを開発した。一般にこのような大規模異種データベースからの相関ルール発見は計算量爆発に陥り実行不可能であるが、探索空間となるデータベースを限定し、さらに相関ルール発見の核となる微小なデータ集合を、利用者の興味に応じて指定させることで回避できることが示された。
Index number of masato に raised large し 続 け る ゲ ノ ム デ ー タ ベ ー ス か ら automatic に な useful knowledge を 発 see す る こ と の importance が criticism in recent years さ れ て い る. こ れ に し seaborne author ら は デ ー タ ベ ー の eset で ス research attention さ れ て い る デ ー タ マ イ ニ ン グ gimmick を with い た knowledge 発 see に つ い て を line な っ て い る. し か し, massive か つ many many others な ゲ ノ ム デ ー タ ベ ー ス か snare に knowledge 発 see line を な う た め に は, knowledge 発 see の エ ン ジ ン と various の デ ノ ム parsing ソ フ ト ウ ェ ア を ど の よ う に phase masato ル ー ル 発 see シ ス テ ム に integration し て い く か が big き な problem で あ る. This year に, the previous year に issued たプロトタ プ プ プ <s:1> improved を line なった. Youdaoplaceholder0, visualization モジュ モジュ モジュ (PDB) High - light) modified す を る こ と に よ り, similar structure 検 モ ジ ュ ー ル (PACADE) お よ び デ ー タ マ イ ニ ン グ モ ジ ュ ー ル か ら の exhaled を strengthening し, さ ら に external の ゲ ノ ム parsing プ ロ グ ラ ム (example え ば FASTA な ど の ホ モ ロ ジ ー 検 cable) か ら も easy に shout び out せ る よ う な pan The なパラメ なパラメ タ タ is received by the <s:1> を line なうモジュ <s:1> と と て てPDB hige-lightを and then reassembled た. ま た, visual results を も と に external の parsing / 検 cable シ ス テ ム を easy に shout び out せ る function を plus し た. こ れ に よ り, ゲ ノ ム ネ ッ ト (http://www.genome.ad.jp/) が retain す る various ゲ ノ ム デ ー タ ベ ー ス と の connecting が easy に な り, day 々 update さ れ る デ ー タ に し seaborne て 検 cable/visual / マ イ ニ ン グ の 3 つ を organic に knot び つ け た サ ー ビ ス を build で き た. Now こ の integration サ ー ビ ス WebPACADE は, ゲ ノ ム ネ ッ ト で on WWW を tong し て public さ れ, using さ れ て い る. WebPACADE の デ ー タ マ イ ニ ン グ モ ジ ュ ー ル は advocate に protein masato の knowledge 発 see line を な う が, こ の モ ジ ュ ー ル を yuan に, ゲ ノ ム ネ ッ ト の on 20 に お よ ぶ various ゲ ノ ム デ ー タ を group み close せ て snare に knowledge 発 see line を な う モ ジ ュ ー ル を open 発 し た. General に こ の よ う な large-scale heterogeneous デ ー タ ベ ー ス か ら の phase masato ル ー ル 発 see は computation detonation 発 に 陥 り line be impossible で あ る が, exploring space と な る デ ー タ ベ ー ス を qualified し, さ ら に phase masato ル ー ル 発 see の nuclear と な る tiny な デ ー タ collection を, ik の tumblers に 応 じ て specified さ せ る こ と で avoid で き る こ と が shown さ れ Youdaoplaceholder0.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中西由紀子他4名: "データマイニングを利用したタンパク質の機能・構造間相関ルール抽出" 第21回日本分子生物学会年会. 348-348 (1998)
Yukiko Nakanishi 等 4 人:“使用数据挖掘提取蛋白质功能/结构相关性规则”第 21 届日本分子生物学会年会 348-348(1998 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
古市恵美子他3名: "WebPACADEの類似構造検索機能を用いたタンパク質のクラスタリング" 第21回日本分子生物学会年会. 348-348 (1998)
Emiko Furuichi 等 3 人:“使用 WebPACADE 的相似结构搜索功能进行蛋白质聚类”第 21 届日本分子生物学会年会 348-348(1998 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Kenji Satou 他5名: "WebPACADE : a System for the Analysis of Structural Similarity of Protein via WWW" Genome Informatics 1997. 338-339 (1997)
Kenji Satou 和其他 5 人:“WebPACADE:通过 WWW 分析蛋白质结构相似性的系统” Genome Informatics 1997. 338-339 (1997)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Kenji Satou 他5名: "Substructures of Proteins Essential to their Biological Functions by a Data Mining Technique" Proc.of the 5th Int.Conf.on Intelligent Systems for Molecular Biology(ISMB'97). 254-257 (1997)
Kenji Satou 和其他 5 人:“通过数据挖掘技术确定其生物功能所必需的蛋白质的子结构”第五届国际分子生物学智能系统会议 (ISMB97) (1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

佐藤 賢二其他文献

佐藤 賢二的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('佐藤 賢二', 18)}}的其他基金

ゲノムデータベースからの相関ルール発見に関する研究
基因组数据库关联规则发现研究
  • 批准号:
    08780331
  • 财政年份:
    1996
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
演繹データベースにおける類似解検索手法に関する研究
演绎数据库中相似解搜索方法研究
  • 批准号:
    05780297
  • 财政年份:
    1993
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

ゲノムデータベースからの相関ルール発見に関する研究
基因组数据库关联规则发现研究
  • 批准号:
    08780331
  • 财政年份:
    1996
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
Art Related Articles in Japanese Newspapers (I): Around the Taisho Period
日本报纸上的艺术相关文章(一):大正时代前后
  • 批准号:
    02451007
  • 财政年份:
    1990
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了