Fast Query Processing for Large Scientific Databases
大型科学数据库的快速查询处理
基本信息
- 批准号:22K17894
- 负责人:
- 金额:$ 3万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2026-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
本年度は研究計画に基づき,(1)プロパティグラフ集合ならびに(2)文字列シーケンス集合に対するモチーフに基づくデータ要約技術の開拓と,これらの技術を活用した類似・相関問合せ処理の高速化手法の開発に取り組んだ.各取り組みと研究成果について以下に記載する.(1)本項目では創薬を目的として公開されているタンパク質DBをプロパティグラフ集合とみなし,データ要約と要約に基づく高速な相関問合せ処理手法の開発を行った.データ要約手法ではタンパク質DBにおいて頻出構造を捉える.ランダムに選択した頻出構造はタンパク質DB内において単一ノードなどの簡潔な構造へと要約を行う.このような要約DBを事前に複数構築し,問合せ処理の際には全ての要約DBに対して乱択アルゴリズムに基づいて検索処理を実行する.各要約は少数のノードから構成されることから,従来よりも高速に問合せ処理を実行可能である.また,乱択アルゴリズムにより偽陰性を排除することが可能である.本研究の成果は現在,国際会議に投稿中である.(2)本項目ではDNAシーケンサを用いて獲得したDNAシーケンスDBを題材としてデータ要約技術ならびに問合せ処理技術の開発を行った.DNAシーケンスは4種類の文字から構成される文字列として保存されている.本研究では編集距離を用いたDNAシーケンスDBにおける類似問合せに取り組んだ.(1)で示した方式と同様に,データベース内で頻出する部分シーケンスを着目し,これらを短い文字列へと置き換えることでデータ要約を行う.要約したDNAシーケンス集合に対して編集距離計算を行う際は,各要約から導き出される編集距離の値の上界・下界を用いて探索不要なDNAシーケンスを特定し,問合せ処理の対象から除外する.この方式により,大規模なDNAシーケンスDBに対する高速な問合せ処理を実現した.本研究の成果は国際会議にて発表を行った.
Research projects for this year's は に base づ き, (1) プ ロ パ テ ィ グ ラ フ collection な ら び に (2) text columns シ ー ケ ン ス collection に す seaborne る モ チ ー フ に base づ く デ ー タ offer technology explore the と の こ れ ら の technology を use し た, similar phase, masato asked us せ 処 Richard の high technique の open 発 に group take り ん だ. Take the みと research results of each of the みと groups に に て て て て the following に records する. (1) the project で は gen 薬 を purpose と し て public さ れ て い る タ ン パ ク qualitative DB を プ ロ パ テ ィ グ ラ フ collection と み な し, デ ー タ offer と an に base づ く high-speed な phase masato asked us せ 処 Richard gimmick の open 発 を line っ た. デ ー タ offer technique で は タ ン パ ク qualitative DB に お い て mount structure を catch え る. ラ ン ダ ム に sentaku し た mount structure は タ ン パ ク mass within the DB に お い て 単 a ノ ー ド な ど の concise な tectonic へ と offer う を line. こ の よ う な DB に plural を advance build し offer, ask us せ 処 Richard の interstate に は full て の offer DB に し seaborne て disorderly 択 ア ル ゴ リ ズ ム に base づ い て 検 cable 処 Richard を line be す る. Each offer は minority の ノ ー ド か ら constitute さ れ る こ と か ら, 従 to よ り も high-speed に asked us せ 処 Richard を may be line で あ る. Youdaoplaceholder0, random 択ア ゴリズムによ ゴリズムによ <s:1> false negative を to rule out する とが とが possibly である. The に results of this study are now available for submission at the international conference に である. (2) the project で は DNA シ ー ケ ン サ を with い て get し た DNA シ ー ケ ン ス DB を subject と し て デ ー タ offer technical な ら び に asked us せ 処 manage technology の open 発 を line っ た. DNA シ ー ケ ン ス は 4 kinds の text か ら constitute さ れ る text columns と し て save さ れ て い る. Compiling from this study で は を with い た DNA シ ー ケ ン ス DB に お け る similar asked us せ に group take り ん だ. (1) で shown し と た way with others に, デ ー タ ベ ー ス で within mount す る part シ ー ケ ン ス を mesh し, こ れ ら を short い text columns へ と buy き in え る こ と で デ ー タ offer う を line. Offer し た DNA シ ー ケ ン ス collection に し seaborne て compiling the line distance calculation を う は, each offer か ら guide き out さ れ る arranged on distance の numerical の upper bound, lower bound を with い て explore don't な DNA シ ー ケ ン ス を specific し, ask us せ 処 Richard の polices like か ら except す る. こ の way に よ り, large-scale な DNA シ ー ケ ン ス DB に す seaborne る high-speed な asked us せ 処 Richard を be presently し た. The research results of this study were presented at the にて international conference を and った.
项目成果
期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Indexing complex networks for fast attributed kNN queries
- DOI:10.1007/s13278-022-00904-w
- 发表时间:2022-07
- 期刊:
- 影响因子:2.8
- 作者:Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
- 通讯作者:Suomi Kobayashi;Shohei Matsugu;Hiroaki Shiokawa
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
塩川 浩昭其他文献
大規模グラフに対するObjectRankの高速化
加速大图的 ObjectRank
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
松下 朋弘;塩川 浩昭;北川 博之;佐藤 朋紀,塩川 浩昭,北川 博之;高橋知克,塩川浩昭,北川博之;佐藤朋紀,塩川浩昭,山口祐人,北川博之 - 通讯作者:
佐藤朋紀,塩川浩昭,山口祐人,北川博之
CRISPR/Cas9 mcdiated genome editing in mice and its application for the study of reproduction
CRISPR/Cas9介导的小鼠基因组编辑及其在生殖研究中的应用
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
佐藤 朋紀;塩川 浩昭;山口 祐人;北川博之;千葉 親文;伊川正人;清水晶紀;伊川正人 - 通讯作者:
伊川正人
The Allium Genome
葱基因组
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
佐藤 朋紀;塩川 浩昭;山口祐人;北川博之;Hideki Hirakawa - 通讯作者:
Hideki Hirakawa
メッセージ集約に基づくAffinity Propagationの高速化
基于消息聚合加速亲和力传播
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
松下 朋弘;塩川 浩昭;北川 博之 - 通讯作者:
北川 博之
ビッグデータを瞬時に計算する
即时计算大数据
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Tomoki Sato;Hiroaki Shiokawa;Yuto Yamaguchi;Hiroyuki Kitagawa;塩川 浩昭 - 通讯作者:
塩川 浩昭
塩川 浩昭的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
移動オブジェクト技術に基づくセンサデータベースの適応的問合せ処理に関する研究
基于运动对象技术的传感器数据库自适应查询处理研究
- 批准号:
19024037 - 财政年份:2007
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
高精度XML文書検索システムの問合せ処理高速化に関する研究
高精度XML文档检索系统查询加速处理研究
- 批准号:
16700103 - 财政年份:2004
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
コレクションオブジェクトに対する索引を用いたデータベース問合せ処理の研究
基于集合对象索引的数据库查询处理研究
- 批准号:
08780284 - 财政年份:1996
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
論理プログラムの意味論と問合せ処理の最適化技術の研究
逻辑程序语义与查询处理优化技术研究
- 批准号:
06680353 - 财政年份:1994
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
分散形データベースにおける同時実行制御も含めた問合せ処理に関する研究
分布式数据库中包含并发控制的查询处理研究
- 批准号:
01750340 - 财政年份:1989
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)