大規模ゲノム情報の高度な検索・比較に関する基礎技術開発とデータマイニングへの応用

大规模基因组信息高级搜索、比对基础技术开发及其在数据挖掘中的应用

基本信息

  • 批准号:
    17018023
  • 负责人:
  • 金额:
    $ 2.3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 无数据
  • 项目状态:
    已结题

项目摘要

ゲノム研究に関わるデータは巨大なものが多い.ゲノム自身が巨大な文字列データであることをはじめ,遺伝子やたんぱく質,生物種など,多くの項目を持つデータがある.また,マイクロアレイ技術の発達により,多くの実験を短時間で行えるようになったことも,実験結果のデータを巨大化させている.これら巨大なデータベースを解析し,全体的な特徴の観察や、類似する項目の発見・グループ分け(類似検索・クラスタリング),確からしいルール・特徴ある部分構造の発見(ルール/データマイニング)を行うことは,ゲノム研究において非常に重要な位置を占める.しかし,データが巨大であるため,従来の素朴な方法では計算に莫大な時間がかかる.しかし,この種の問題では,出力する解の数は全ての組合せよりはるかに小さいことが多い.類似する項目を例に挙げれば,一つの項目は他の高々数個の項目とのみ類似する場合が多い.そもそも,非常に多くの項目が類似するようなデータベースは,類似する項目を全て列挙すること自体に意味がない.全ての項目を総当りで比較するのではなく,効率良く類似する可能性のあるペアだけを絞り込むことができれば,極めて短時間で計算を終了することが可能である.本研究班では,ゲノム情報学に現れる基礎的なデータベース解析問題や最適化問題に対して,精度が高くかつ高速なアルゴリズムを開発することとその解析を目指して研究を行った.具体的には、トランザグションデータあるいは各項目が正負のみをとるデータが与えられたとき,その中から真である項目の多くに当てはまるが偽である項目にはほとんど当てはまらないようなパターンの列挙を考え,確率的解析を通して生成されたパターンの信頼性に対する指針を与えた.また,トランザクションデータベースから頻出集合を見つける問題や,文字列データの中から頻出する極大モチーフを全て発見する問題に対して効率良いアルゴリズムを開発した.
The research on the problem is very complicated. The text itself is huge, the character is natural, the biological species is natural, and the multiple items are natural. The technology development process is very fast, and the results are very large. This paper analyzes the characteristics of the whole structure, analyzes the discovery of similar items, and determines the discovery of some structural features. The time for calculation is great. The number of solutions to these problems is the total number of combinations. For example, similar items are included in the list, one item is higher than the other, and several items are similar in many cases. All kinds of items are similar to each other. All items are compared, the efficiency is good, the probability is high, the calculation is short, the probability is low. This research class aims to conduct research on the analysis of optimization problems with high precision and high speed. In the case of concrete problems, the number of items in each item is negative, and the number of items in each item is false. The problem of frequent occurrence of a set of text strings is solved by solving the problem of frequent occurrence of a maximum set of text strings.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A randomness based analysis on the data size needed for generating reliable rules
对生成可靠规则所需的数据大小进行基于随机性的分析
A Polynomial Space and Polynomial Delay Algorithm for Enumeration of Maximal Motifs in a Sequence
用于枚举序列中最大图案的多项式空间和多项式延迟算法
Measuring Over-generalization in the Minimal Multiple Generalizations of Biosequences
测量生物序列最小多重泛化中的过度泛化
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

柳浦 睦憲其他文献

Local Search Algorithms for the Two-Dimensional Cutting Stock Problem with a Given Number of Different Patterns (数理最適化から見た「凸性の深み、非凸性の魅惑」研究集会報告集)
给定数量不同模式的二维下料问题的局部搜索算法(数学优化角度凸性深度与非凸性魅力研究会报告)
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    今堀 慎治;柳浦 睦憲;足達 信也;茨木 俊秀;梅谷 俊治
  • 通讯作者:
    梅谷 俊治

柳浦 睦憲的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('柳浦 睦憲', 18)}}的其他基金

物流を支える基盤技術としての数理最適化とメタ戦略
数学优化和元策略作为支持物流的基础技术
  • 批准号:
    23K20268
  • 财政年份:
    2024
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
物流を支える基盤技術としての数理最適化とメタ戦略
数学优化和元策略作为支持物流的基础技术
  • 批准号:
    20H02388
  • 财政年份:
    2020
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
大規模ゲノムデータ処理に対する高速高精度アルゴリズムの開発
开发用于大规模基因组数据处理的高速、高精度算法
  • 批准号:
    18017015
  • 财政年份:
    2006
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模組合せ最適化問題に対するハイブリッドメタ戦略アルゴリズムの開発と評価
针对大规模组合优化问题的混合元策略算法的开发和评估
  • 批准号:
    17700016
  • 财政年份:
    2005
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
大規模かつ複雑な組合せ最適化問題に対する効率的かつ汎用的メタ戦略の開発と応用
针对大规模复杂组合优化问题的高效通用元策略的开发和应用
  • 批准号:
    14750333
  • 财政年份:
    2002
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
大規模組合せ最適化問題に対する効率的メタ戦略の設計と評価
大规模组合优化问题的有效元策略的设计和评估
  • 批准号:
    11750350
  • 财政年份:
    1999
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模組合せ最適化問題に対するメタ戦略のロバスト性に関する実験的解析
大规模组合优化问题元策略鲁棒性的实验分析
  • 批准号:
    09750453
  • 财政年份:
    1997
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模組合せ最適化問題に対するメタ戦略のロバスト性に関する研究
大规模组合优化问题元策略的鲁棒性研究
  • 批准号:
    08750479
  • 财政年份:
    1996
  • 资助金额:
    $ 2.3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了