高速ネットワークのための文字列ストリーム処理アルゴリズム

高速网络的字符串流处理算法

基本信息

  • 批准号:
    17700019
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2006
  • 项目状态:
    已结题

项目摘要

文字列の高速検索のために用いられるデータ構造である接尾辞木について,それを圧縮したデータ構造を開発した.このデータ構造は従来の接尾辞木でできる操作は全て可能であり,その計算量もほとんどの操作では圧縮前と同じである.このデータ構造により,多くの文字列処理問題を解くために必要なメモリを削減することができる.Rank/Select辞書とは,順序集合$S in {0,1,...,m-1}$において${it rank}(x,S)=|{y in S|y le x }|$と${it select}(i,S)$($S$の中で$i$番目に小さい要素)を返すデータ構造である.これは文字列,木,グラフなどの圧縮データ構造の基本構成要素であり,多くのデータ構造が提案されている.しかしそれらは漸近的な性能のみを考えており,実データに対する性能は良くない.本研究では単純なRank/Select辞書を提案する.特徴としては,集合$S$の要素数が小さい場合にデータ構造のサイズを縮小できることと,データ構造が単純であるために実装が容易で,実データに対する性能(データ構造のサイズと問い合わせ時間)が良い.実験により,既存の実装よりも速度,サイズともに優れていることを示した.集合$S$は長さ$m$の${0,1}$のベクトル$B[0,m-1]$を用いて表現できる.しかしベクトル$B$をそのまま格納するデータ構造は,$S$の要素数$n$が小さい場合,または多い場合にはサイズに無駄が多い.なぜなら$B$は$m choose n$通りしかないため,$B(n,m)=log{m choose n}approx n log frac{m}{n}+(m-n)log frac{m}{m-n}$ビットで表現できるからである.Ramanら$rank$と$select$を定数時間で求める$B(n,m)+Order(m log log m/log m)$ビットのデータ構造を提案した.本研究で提案するデータ構造は,疎なベクトルに対してデータ構造のサイズが小さくなり,問い合わせ時間は既存のどのデータ構造よりも高速である.
Text columns の 検 high-speed cable の た め に with い ら れ る デ ー タ tectonic で あ る connect tail quit wood に つ い て, そ れ を 圧 shrinkage し た デ ー タ tectonic を open 発 し た. こ の デ ー タ tectonic は 従 to resign の connect end wood で で き る operation は て may で あ り, そ の computation も ほ と ん ど の operation で は 圧 shrink before と with じ で あ る. こ の デ ー タ tectonic に よ り, く の text columns 処 Richard を solutions く た め に necessary な メ モ リ を cut す る こ と が で き る. Rank/Select dictionaries と は, order set $S in {0, 1,... , m - 1} $に お い て ${it rank} (x, S) = | | y le x} {y in S | $と ${it Select} (I, S) $($S $の で $I $'s eye small に さ い elements) を return す デ ー タ tectonic で あ る. こ れ は text columns, wood, グ ラ フ な ど の 圧 shrinkage デ ー タ tectonic の basic elements で あ り, more く の デ ー タ structure proposed が さ れ て い る. し か し そ れ ら は asymptotic performance of な の み を exam え て お り, be デ ー タ The performance of に against する is に good くな に. This study で は 単 pure な Rank/Select dictionaries を proposal す る. Trevor 徴 と し て は, set $S $の elements for small が さ い occasions に デ ー タ tectonic の サ イ ズ を narrow で き る こ と と, デ ー タ tectonic が 単 pure で あ る た め に be が で easily, be デ ー タ に す seaborne る performance (デ ー タ tectonic の サ イ ズ と asked い close わ せ time) が Liang Yi. Be 験 に よ り, existing の be with よ り も speed, サ イ ズ と も に optimal れ て い る こ と を shown し た. Set long さ $m $$S $は の ${0, 1} $の ベ ク ト ル $B [0, 1 m -] $を with い て performance で き る. し か し ベ ク ト ル $B $を そ の ま ま Wagner す る デ ー タ は structure, several $n $$S $の elements が small さ い occasions, ま た は い more occasions に は サ イ ズ に no 駄 が い. な ぜ な ら $m $B $は Choose n $tong り し か な い た め, $B (n, m) = log choose n} {m approx n log frac {m} {n} + (m, n) log Frac {m} {m - n} $ビ ッ ト で performance で き る か ら で あ る. Raman ら $$$$を select と rank number time で め る $B (n, m) + Order (m/log log log m m) $ビ ッ ト の デ ー タ structure proposed を し た. This study proposed で す る デ ー タ tectonic は 疎 な ベ ク ト ル に し seaborne て デ ー タ tectonic の サ イ ズ が small さ く な り, ask い close わ せ time は existing の ど の デ ー タ tectonic よ り も high-speed で あ る.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Finding Short Right-Hand-on-the-Wall Walks in Graphs
在图中寻找短的右手靠墙行走
Compressed suffix trees with full functionality
  • DOI:
    10.1007/s00224-006-1198-x
  • 发表时间:
    2007-11-01
  • 期刊:
  • 影响因子:
    0.5
  • 作者:
    Sadakane, Kunihiko
  • 通讯作者:
    Sadakane, Kunihiko
Computing the Maximum Agreement of Phylogenetic Networks
  • DOI:
    10.1016/j.entcs.2003.12.009
  • 发表时间:
    2004-02
  • 期刊:
  • 影响因子:
    0
  • 作者:
    C. Choy;J. Jansson;K. Sadakane;W. Sung
  • 通讯作者:
    C. Choy;J. Jansson;K. Sadakane;W. Sung
Linear Time Algorithm for Approximating a Curve by a Single-peaked Curve
用单峰曲线逼近曲线的线性时间算法
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    J.Chun;K.Sadakane;T.Tokuyama
  • 通讯作者:
    T.Tokuyama
圧縮データ構造
压缩数据结构
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

定兼 邦彦其他文献

秘匿接尾辞ソーティングとその応用
秘密后缀排序及其应用
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    神保 洸貴;定兼 邦彦
  • 通讯作者:
    定兼 邦彦
拡張型心筋症の発症機序
扩张型心肌病的发病机制
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    神保 洸貴;定兼 邦彦;野村征太郎
  • 通讯作者:
    野村征太郎
簡潔データ構造
简洁的数据结构
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Abou El Hassan W.H.;T. Watanabe and M. R Freeg;定兼 邦彦
  • 通讯作者:
    定兼 邦彦
”聴こえる”ことの未来 ~人工内耳から内耳再生まで~
“听觉”的未来~从人工耳蜗植入到耳蜗再生~
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小池 敦;定兼 邦彦;伊藤壽一
  • 通讯作者:
    伊藤壽一
有限グラフ上の高速ランダムウォーク
有限图上的快速随机游走
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野中 良哲;小野 廣隆;定兼 邦彦;山下 雅史
  • 通讯作者:
    山下 雅史

定兼 邦彦的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('定兼 邦彦', 18)}}的其他基金

圧縮秘匿計算による大規模データ処理
使用压缩秘密计算进行大规模数据处理
  • 批准号:
    21H04871
  • 财政年份:
    2021
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Big Data Processing with Compressed Secure Computation
通过压缩安全计算进行大数据处理
  • 批准号:
    21H05052
  • 财政年份:
    2021
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (S)
大量データ処理のための領域効率の良いアルゴリズム
用于处理大量数据的节省空间的算法
  • 批准号:
    16092222
  • 财政年份:
    2004
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
情報検索のためのコンパクトなデータ構造とその動的更新に関する研究
信息检索的紧凑数据结构及其动态更新研究
  • 批准号:
    15700002
  • 财政年份:
    2003
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
ゲノム配列の高次圧縮・索引構築と高次幾何構造解析による知識発見
通过基因组序列的高阶压缩和索引构建以及高阶几何结构分析进行知识发现
  • 批准号:
    14015204
  • 财政年份:
    2002
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
大規模圧縮文書データベースの構築と高度な検索手法に関する研究
大规模压缩文档数据库构建及先进检索方法研究
  • 批准号:
    13780184
  • 财政年份:
    2001
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
大量の文字列データに対する圧縮と検索
压缩和搜索大量字符串数据
  • 批准号:
    99J09112
  • 财政年份:
    1999
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

スパース接尾辞木を用いた高速マルチストリーム索引の研究開発
利用稀疏后缀树的高速多流索引的研究与开发
  • 批准号:
    15J01438
  • 财政年份:
    2015
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
接尾辞木に基づく大規模文字列索引の効率よい構築アルゴリズム
基于后缀树的大规模字符串索引高效构建算法
  • 批准号:
    09J02025
  • 财政年份:
    2009
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了