Fast Query Processing for Large Scientific Databases

大型科学数据库的快速查询处理

基本信息

  • 批准号:
    22K17894
  • 负责人:
  • 金额:
    $ 3万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2026-03-31
  • 项目状态:
    未结题

项目摘要

本年度は研究計画に基づき,(1)プロパティグラフ集合ならびに(2)文字列シーケンス集合に対するモチーフに基づくデータ要約技術の開拓と,これらの技術を活用した類似・相関問合せ処理の高速化手法の開発に取り組んだ.各取り組みと研究成果について以下に記載する.(1)本項目では創薬を目的として公開されているタンパク質DBをプロパティグラフ集合とみなし,データ要約と要約に基づく高速な相関問合せ処理手法の開発を行った.データ要約手法ではタンパク質DBにおいて頻出構造を捉える.ランダムに選択した頻出構造はタンパク質DB内において単一ノードなどの簡潔な構造へと要約を行う.このような要約DBを事前に複数構築し,問合せ処理の際には全ての要約DBに対して乱択アルゴリズムに基づいて検索処理を実行する.各要約は少数のノードから構成されることから,従来よりも高速に問合せ処理を実行可能である.また,乱択アルゴリズムにより偽陰性を排除することが可能である.本研究の成果は現在,国際会議に投稿中である.(2)本項目ではDNAシーケンサを用いて獲得したDNAシーケンスDBを題材としてデータ要約技術ならびに問合せ処理技術の開発を行った.DNAシーケンスは4種類の文字から構成される文字列として保存されている.本研究では編集距離を用いたDNAシーケンスDBにおける類似問合せに取り組んだ.(1)で示した方式と同様に,データベース内で頻出する部分シーケンスを着目し,これらを短い文字列へと置き換えることでデータ要約を行う.要約したDNAシーケンス集合に対して編集距離計算を行う際は,各要約から導き出される編集距離の値の上界・下界を用いて探索不要なDNAシーケンスを特定し,問合せ処理の対象から除外する.この方式により,大規模なDNAシーケンスDBに対する高速な問合せ処理を実現した.本研究の成果は国際会議にて発表を行った.
Research projects for this year's は に base づ き, (1) プ ロ パ テ ィ グ ラ フ collection な ら び に (2) text columns シ ー ケ ン ス collection に す seaborne る モ チ ー フ に base づ く デ ー タ offer technology explore the と の こ れ ら の technology を use し た, similar phase, masato asked us せ 処 Richard の high technique の open 発 に group take り ん だ. Take the みと research results of each of the みと groups に に て て て て the following に records する. (1) the project で は gen 薬 を purpose と し て public さ れ て い る タ ン パ ク qualitative DB を プ ロ パ テ ィ グ ラ フ collection と み な し, デ ー タ offer と an に base づ く high-speed な phase masato asked us せ 処 Richard gimmick の open 発 を line っ た. デ ー タ offer technique で は タ ン パ ク qualitative DB に お い て mount structure を catch え る. ラ ン ダ ム に sentaku し た mount structure は タ ン パ ク mass within the DB に お い て 単 a ノ ー ド な ど の concise な tectonic へ と offer う を line. こ の よ う な DB に plural を advance build し offer, ask us せ 処 Richard の interstate に は full て の offer DB に し seaborne て disorderly 択 ア ル ゴ リ ズ ム に base づ い て 検 cable 処 Richard を line be す る. Each offer は minority の ノ ー ド か ら constitute さ れ る こ と か ら, 従 to よ り も high-speed に asked us せ 処 Richard を may be line で あ る. Youdaoplaceholder0, random 択ア ゴリズムによ ゴリズムによ <s:1> false negative を to rule out する とが とが possibly である. The に results of this study are now available for submission at the international conference に である. (2) the project で は DNA シ ー ケ ン サ を with い て get し た DNA シ ー ケ ン ス DB を subject と し て デ ー タ offer technical な ら び に asked us せ 処 manage technology の open 発 を line っ た. DNA シ ー ケ ン ス は 4 kinds の text か ら constitute さ れ る text columns と し て save さ れ て い る. Compiling from this study で は を with い た DNA シ ー ケ ン ス DB に お け る similar asked us せ に group take り ん だ. (1) で shown し と た way with others に, デ ー タ ベ ー ス で within mount す る part シ ー ケ ン ス を mesh し, こ れ ら を short い text columns へ と buy き in え る こ と で デ ー タ offer う を line. Offer し た DNA シ ー ケ ン ス collection に し seaborne て compiling the line distance calculation を う は, each offer か ら guide き out さ れ る arranged on distance の numerical の upper bound, lower bound を with い て explore don't な DNA シ ー ケ ン ス を specific し, ask us せ 処 Richard の polices like か ら except す る. こ の way に よ り, large-scale な DNA シ ー ケ ン ス DB に す seaborne る high-speed な asked us せ 処 Richard を be presently し た. The research results of this study were presented at the にて international conference を and った.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Indexing complex networks for fast attributed kNN queries
  • DOI:
    10.1007/s13278-022-00904-w
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    2.8
  • 作者:
    Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
  • 通讯作者:
    Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
グラフ集約に基づく高速な最大k-plex探索
基于图聚合的快速最大k-plex搜索
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    真次 彰平;藤原 靖宏;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
動的グラフにおけるk最近傍探索のための索引更新手法の提案
动态图中k近邻搜索的索引更新方法的提出
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林 瑞季;真次 彰平;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
多次元時系列データに対する高速なモチーフ問合せ手法の提案
一种多维时间序列数据快速motif查询方法的提出
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    安田 裕真;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
グラフデータベースに対する高速高精度な相関問合せ
图数据库快速准确的关联查询
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    直井 悠馬;真次 彰平;塩川 浩昭
  • 通讯作者:
    塩川 浩昭
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

塩川 浩昭其他文献

大規模グラフに対するObjectRankの高速化
加速大图的 ObjectRank
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松下 朋弘;塩川 浩昭;北川 博之;佐藤 朋紀,塩川 浩昭,北川 博之;高橋知克,塩川浩昭,北川博之;佐藤朋紀,塩川浩昭,山口祐人,北川博之
  • 通讯作者:
    佐藤朋紀,塩川浩昭,山口祐人,北川博之
CRISPR/Cas9 mcdiated genome editing in mice and its application for the study of reproduction
CRISPR/Cas9介导的小鼠基因组编辑及其在生殖研究中的应用
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 朋紀;塩川 浩昭;山口 祐人;北川博之;千葉 親文;伊川正人;清水晶紀;伊川正人
  • 通讯作者:
    伊川正人
The Allium Genome
葱基因组
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 朋紀;塩川 浩昭;山口祐人;北川博之;Hideki Hirakawa
  • 通讯作者:
    Hideki Hirakawa
メッセージ集約に基づくAffinity Propagationの高速化
基于消息聚合加速亲和力传播
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松下 朋弘;塩川 浩昭;北川 博之
  • 通讯作者:
    北川 博之
ビッグデータを瞬時に計算する
即时计算大数据
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tomoki Sato;Hiroaki Shiokawa;Yuto Yamaguchi;Hiroyuki Kitagawa;塩川 浩昭
  • 通讯作者:
    塩川 浩昭

塩川 浩昭的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

移動オブジェクト技術に基づくセンサデータベースの適応的問合せ処理に関する研究
基于运动对象技术的传感器数据库自适应查询处理研究
  • 批准号:
    19024037
  • 财政年份:
    2007
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
高精度XML文書検索システムの問合せ処理高速化に関する研究
高精度XML文档检索系统查询加速处理研究
  • 批准号:
    16700103
  • 财政年份:
    2004
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
コレクションオブジェクトに対する索引を用いたデータベース問合せ処理の研究
基于集合对象索引的数据库查询处理研究
  • 批准号:
    08780284
  • 财政年份:
    1996
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
論理プログラムの意味論と問合せ処理の最適化技術の研究
逻辑程序语义与查询处理优化技术研究
  • 批准号:
    06680353
  • 财政年份:
    1994
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
分散形データベースにおける同時実行制御も含めた問合せ処理に関する研究
分布式数据库中包含并发控制的查询处理研究
  • 批准号:
    01750340
  • 财政年份:
    1989
  • 资助金额:
    $ 3万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了