Fast Query Processing for Large Scientific Databases

大型科学数据库的快速查询处理

基本信息

  • 批准号:
    22K17894
  • 负责人:
  • 金额:
    $ 3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2026-03-31
  • 项目状态:
    未结题

项目摘要

本年度は研究計画に基づき,(1)プロパティグラフ集合ならびに(2)文字列シーケンス集合に対するモチーフに基づくデータ要約技術の開拓と,これらの技術を活用した類似・相関問合せ処理の高速化手法の開発に取り組んだ.各取り組みと研究成果について以下に記載する.(1)本項目では創薬を目的として公開されているタンパク質DBをプロパティグラフ集合とみなし,データ要約と要約に基づく高速な相関問合せ処理手法の開発を行った.データ要約手法ではタンパク質DBにおいて頻出構造を捉える.ランダムに選択した頻出構造はタンパク質DB内において単一ノードなどの簡潔な構造へと要約を行う.このような要約DBを事前に複数構築し,問合せ処理の際には全ての要約DBに対して乱択アルゴリズムに基づいて検索処理を実行する.各要約は少数のノードから構成されることから,従来よりも高速に問合せ処理を実行可能である.また,乱択アルゴリズムにより偽陰性を排除することが可能である.本研究の成果は現在,国際会議に投稿中である.(2)本項目ではDNAシーケンサを用いて獲得したDNAシーケンスDBを題材としてデータ要約技術ならびに問合せ処理技術の開発を行った.DNAシーケンスは4種類の文字から構成される文字列として保存されている.本研究では編集距離を用いたDNAシーケンスDBにおける類似問合せに取り組んだ.(1)で示した方式と同様に,データベース内で頻出する部分シーケンスを着目し,これらを短い文字列へと置き換えることでデータ要約を行う.要約したDNAシーケンス集合に対して編集距離計算を行う際は,各要約から導き出される編集距離の値の上界・下界を用いて探索不要なDNAシーケンスを特定し,問合せ処理の対象から除外する.この方式により,大規模なDNAシーケンスDBに対する高速な問合せ処理を実現した.本研究の成果は国際会議にて発表を行った.
This year's research project is based on the research plan, (1) Research project collection system (2) Text series collection program (2) Character series collection project It is based on the development of technology and the utilization of technology, and the speed-up method of similar and related problems is combined. The research results of each group are recorded below. (1) The purpose and purpose of this project is to disclose the quality of the project to the public Collection of とみなし, データ offer and offer にbase づくHighway な related questions and cooperation せ processing techniques の开発を行った. The データ offer technique is the same as the quality DB and the structure is frequently used.ランダムに选択した frequent structure はタンパクquality DB inner において単一ノードなどの Simple な structure へとoffer を行う.このような Offer DB を Prior to plural construction し, ask for cooperation せ processing のinterior には全てのOffer DB に対して乱択アルゴリズムにbased づいて検SO handle を実行する. Each offer is made up of a small number of items, and it is possible to deal with the problem at high speed.また, random 択アルゴリズムによりfalse negative をexclude することがpossible である. The results of this research are currently being submitted for international conferences. (2) In this project, the DNA tester uses the DNA tester to obtain the DNA tester D B を theme と し て デ ー タ offer technology な ら び に ask together せ processing technology の 発 を 行 っ た. DNAシーケンスは4Types of charactersからConstitutionされるcharacter sequenceとしてSaveされている. The compilation distance of this study is similar to that of the DNA test using the DB test. (1) The method of showing the same thing is the same as that of the same one, and the part of the part that shows the same thing is the same as the inner one.を目し, これらを Short い character string へとSETきchange えることでデータ OFFER を行う. The offer is a DNA collection, the compilation distance is calculated, and each offer is a guide and the compilation distance isの値の Upper bound and lower bound を Use いて to explore なDNA シーケンスをSpecific し, ask for cooperation せprocess の対 elephant からExcept する.このWAY により, large-scale なDNA シーケンスDB に対する HIGH-SPEED なwen合せprocessing を実成した. The results of this research were presented at an international conference.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Indexing complex networks for fast attributed kNN queries
  • DOI:
    10.1007/s13278-022-00904-w
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    2.8
  • 作者:
    Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
  • 通讯作者:
    Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
グラフ集約に基づく高速な最大k-plex探索
基于图聚合的快速最大k-plex搜索
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    真次 彰平;藤原 靖宏;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
動的グラフにおけるk最近傍探索のための索引更新手法の提案
动态图中k近邻搜索的索引更新方法的提出
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林 瑞季;真次 彰平;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
多次元時系列データに対する高速なモチーフ問合せ手法の提案
一种多维时间序列数据快速motif查询方法的提出
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    安田 裕真;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
グラフデータベースに対する高速高精度な相関問合せ
图数据库快速准确的关联查询
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    直井 悠馬;真次 彰平;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

塩川 浩昭其他文献

大規模グラフに対するObjectRankの高速化
加速大图的 ObjectRank
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松下 朋弘;塩川 浩昭;北川 博之;佐藤 朋紀,塩川 浩昭,北川 博之;高橋知克,塩川浩昭,北川博之;佐藤朋紀,塩川浩昭,山口祐人,北川博之
  • 通讯作者:
    佐藤朋紀,塩川浩昭,山口祐人,北川博之
CRISPR/Cas9 mcdiated genome editing in mice and its application for the study of reproduction
CRISPR/Cas9介导的小鼠基因组编辑及其在生殖研究中的应用
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 朋紀;塩川 浩昭;山口 祐人;北川博之;千葉 親文;伊川正人;清水晶紀;伊川正人
  • 通讯作者:
    伊川正人
The Allium Genome
葱基因组
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 朋紀;塩川 浩昭;山口祐人;北川博之;Hideki Hirakawa
  • 通讯作者:
    Hideki Hirakawa
メッセージ集約に基づくAffinity Propagationの高速化
基于消息聚合加速亲和力传播
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松下 朋弘;塩川 浩昭;北川 博之
  • 通讯作者:
    北川 博之
ビッグデータを瞬時に計算する
即时计算大数据
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoki Sato;Hiroaki Shiokawa;Yuto Yamaguchi;Hiroyuki Kitagawa;塩川 浩昭
  • 通讯作者:
    塩川 浩昭

塩川 浩昭的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

移動オブジェクト技術に基づくセンサデータベースの適応的問合せ処理に関する研究
基于运动对象技术的传感器数据库自适应查询处理研究
  • 批准号:
    19024037
  • 财政年份:
    2007
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高精度XML文書検索システムの問合せ処理高速化に関する研究
高精度XML文档检索系统查询加速处理研究
  • 批准号:
    16700103
  • 财政年份:
    2004
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コレクションオブジェクトに対する索引を用いたデータベース問合せ処理の研究
基于集合对象索引的数据库查询处理研究
  • 批准号:
    08780284
  • 财政年份:
    1996
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
論理プログラムの意味論と問合せ処理の最適化技術の研究
逻辑程序语义与查询处理优化技术研究
  • 批准号:
    06680353
  • 财政年份:
    1994
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
分散形データベースにおける同時実行制御も含めた問合せ処理に関する研究
分布式数据库中包含并发控制的查询处理研究
  • 批准号:
    01750340
  • 财政年份:
    1989
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了