Fast Query Processing for Large Scientific Databases

大型科学数据库的快速查询处理

基本信息

  • 批准号:
    22K17894
  • 负责人:
  • 金额:
    $ 3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2026-03-31
  • 项目状态:
    未结题

项目摘要

本年度は研究計画に基づき,(1)プロパティグラフ集合ならびに(2)文字列シーケンス集合に対するモチーフに基づくデータ要約技術の開拓と,これらの技術を活用した類似・相関問合せ処理の高速化手法の開発に取り組んだ.各取り組みと研究成果について以下に記載する.(1)本項目では創薬を目的として公開されているタンパク質DBをプロパティグラフ集合とみなし,データ要約と要約に基づく高速な相関問合せ処理手法の開発を行った.データ要約手法ではタンパク質DBにおいて頻出構造を捉える.ランダムに選択した頻出構造はタンパク質DB内において単一ノードなどの簡潔な構造へと要約を行う.このような要約DBを事前に複数構築し,問合せ処理の際には全ての要約DBに対して乱択アルゴリズムに基づいて検索処理を実行する.各要約は少数のノードから構成されることから,従来よりも高速に問合せ処理を実行可能である.また,乱択アルゴリズムにより偽陰性を排除することが可能である.本研究の成果は現在,国際会議に投稿中である.(2)本項目ではDNAシーケンサを用いて獲得したDNAシーケンスDBを題材としてデータ要約技術ならびに問合せ処理技術の開発を行った.DNAシーケンスは4種類の文字から構成される文字列として保存されている.本研究では編集距離を用いたDNAシーケンスDBにおける類似問合せに取り組んだ.(1)で示した方式と同様に,データベース内で頻出する部分シーケンスを着目し,これらを短い文字列へと置き換えることでデータ要約を行う.要約したDNAシーケンス集合に対して編集距離計算を行う際は,各要約から導き出される編集距離の値の上界・下界を用いて探索不要なDNAシーケンスを特定し,問合せ処理の対象から除外する.この方式により,大規模なDNAシーケンスDBに対する高速な問合せ処理を実現した.本研究の成果は国際会議にて発表を行った.
This year, the research plan is based on (1) the development and application of basic technology for the collection of data,(2) the development and application of high-speed methods for the processing of similar and related data, and (3) the development and application of high-speed technologies for the collection of data. The results of each group's research are described below. (1) The project aims to open up the quality database to the public, and the development of high-speed correlation processing methods for the basic offer. The method of offering is to change the quality of DB. Select the most frequent structure from the list and select the most simple structure from the list in the Quality DB. The offer DB is constructed in advance, and the query processing is carried out in response to the request from the database. Each offer is made up of a small number of high-speed problems and can be implemented. This is a false negative. The results of this research are now available for submission to international conferences. (2) In this project, DNA is used to obtain DNA from DB, subject matter, offer technology, and development of fusion processing technology.DNA is used to obtain DNA from DB, subject matter, offer technology, development, development, development, In this study, the distance between the two sets of data is used to determine the similarity between the two sets of data. (1) The method of showing the same is the same as that of showing the same, and the part of the text that is frequently displayed in the text is the same as that of showing the same. The upper bound and lower bound of the compilation distance of each offer are explored during the calculation of the compilation distance of the offer DNA set. This method enables high-speed data processing on a large scale. The results of this study were presented at international conferences.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Indexing complex networks for fast attributed kNN queries
  • DOI:
    10.1007/s13278-022-00904-w
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    2.8
  • 作者:
    Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
  • 通讯作者:
    Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
グラフ集約に基づく高速な最大k-plex探索
基于图聚合的快速最大k-plex搜索
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    真次 彰平;藤原 靖宏;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
動的グラフにおけるk最近傍探索のための索引更新手法の提案
动态图中k近邻搜索的索引更新方法的提出
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林 瑞季;真次 彰平;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
多次元時系列データに対する高速なモチーフ問合せ手法の提案
一种多维时间序列数据快速motif查询方法的提出
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    安田 裕真;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
グラフデータベースに対する高速高精度な相関問合せ
图数据库快速准确的关联查询
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    直井 悠馬;真次 彰平;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

塩川 浩昭其他文献

大規模グラフに対するObjectRankの高速化
加速大图的 ObjectRank
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松下 朋弘;塩川 浩昭;北川 博之;佐藤 朋紀,塩川 浩昭,北川 博之;高橋知克,塩川浩昭,北川博之;佐藤朋紀,塩川浩昭,山口祐人,北川博之
  • 通讯作者:
    佐藤朋紀,塩川浩昭,山口祐人,北川博之
CRISPR/Cas9 mcdiated genome editing in mice and its application for the study of reproduction
CRISPR/Cas9介导的小鼠基因组编辑及其在生殖研究中的应用
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 朋紀;塩川 浩昭;山口 祐人;北川博之;千葉 親文;伊川正人;清水晶紀;伊川正人
  • 通讯作者:
    伊川正人
The Allium Genome
葱基因组
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 朋紀;塩川 浩昭;山口祐人;北川博之;Hideki Hirakawa
  • 通讯作者:
    Hideki Hirakawa
メッセージ集約に基づくAffinity Propagationの高速化
基于消息聚合加速亲和力传播
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松下 朋弘;塩川 浩昭;北川 博之
  • 通讯作者:
    北川 博之
ビッグデータを瞬時に計算する
即时计算大数据
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoki Sato;Hiroaki Shiokawa;Yuto Yamaguchi;Hiroyuki Kitagawa;塩川 浩昭
  • 通讯作者:
    塩川 浩昭

塩川 浩昭的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

移動オブジェクト技術に基づくセンサデータベースの適応的問合せ処理に関する研究
基于运动对象技术的传感器数据库自适应查询处理研究
  • 批准号:
    19024037
  • 财政年份:
    2007
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高精度XML文書検索システムの問合せ処理高速化に関する研究
高精度XML文档检索系统查询加速处理研究
  • 批准号:
    16700103
  • 财政年份:
    2004
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コレクションオブジェクトに対する索引を用いたデータベース問合せ処理の研究
基于集合对象索引的数据库查询处理研究
  • 批准号:
    08780284
  • 财政年份:
    1996
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
論理プログラムの意味論と問合せ処理の最適化技術の研究
逻辑程序语义与查询处理优化技术研究
  • 批准号:
    06680353
  • 财政年份:
    1994
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
分散形データベースにおける同時実行制御も含めた問合せ処理に関する研究
分布式数据库中包含并发控制的查询处理研究
  • 批准号:
    01750340
  • 财政年份:
    1989
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了