情報検索のためのコンパクトなデータ構造とその動的更新に関する研究
信息检索的紧凑数据结构及其动态更新研究
基本信息
- 批准号:15700002
- 负责人:
- 金额:$ 1.28万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2003
- 资助国家:日本
- 起止时间:2003 至 2004
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
大量データ処理のための領域効率のよいアルゴリズムとデータ構造の開発を行った.まず,文字列の高速検索を行うデータ構造として,すでに圧縮接尾辞配列が提案されているが,それを構築する省メモリなアルゴリズムを開発した.このアルゴリズムは定数サイズアルファベット上の文字列に関しては時間・領域ともに最適であり,定数サイズではない場合にも従来手法より高速である.具体的には,アルファベットサイズをΣ,文字列長をnとしたとき,O(n log Σ)領域,O(n log n)時間である.また,このアルゴリズムよりも時間はかかるが,圧縮率の高い文字列についてはさらに省スペースなアルゴリズムも考案した.計算量は,O(n log n)時間である(HOは文字列の次数0のエントロピー).次に,複数の文字列の検索が可能なデータ構造を提案した.これは文字列の挿入・削除を高速に実行でき,検索も高速である.また,文字列だけでなく,一般の数列を表現するデータ構造についても考察した.このデータ構造は,数字の更新(増加),数列の和,検索を効率よく行え,必要な領域はほぼ最適である.さらに,圧縮接尾辞配列のデータ構造として二次記憶での実装や分散環境に適したものを提案した.これにより,より大量のデータに対する検索を高速に行えるようになった.
A large number of data processing and domain efficiency of the development of data structure. The text column is constructed by a high speed search engine. The text column is constructed by a compression engine. The text on the text column is related to the time and field. The optimum time and field are related to the time and field. The optimum time and field are related to the speed and speed of the text. Specific, O(n log Σ) field,O (n log n) time. In addition, the number of times when the file is closed is reduced, and the number of times when the file is closed is reduced. Calculation quantity,O(n log n) time (HO). Second, the search for multiple character strings is possible with the proposed structure. The text line is inserted, removed, and the speed is high. The text column is divided into two parts, and the general sequence is divided into two parts. The structure of this problem, the update of the number (increase), the sum of the series, the search efficiency, the necessary field, the optimal field. In addition, the data structure of compressed tail word arrangement and secondary memory are suitable for distributed environment. A large number of high-speed vehicles are required.
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Breaking a time-and-space barrier in constructing full-text indices
- DOI:10.1109/sfcs.2003.1238199
- 发表时间:2003-10
- 期刊:
- 影响因子:0
- 作者:W. Hon;K. Sadakane;W. Sung
- 通讯作者:W. Hon;K. Sadakane;W. Sung
Compressed Index for Dynamic Text
动态文本的压缩索引
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:W.K.Hon;T.W.Lam;Kunihiko Sadakane;W.K Sung;S.M Yiu
- 通讯作者:S.M Yiu
W.K.Hon, T.W.Lam, K.Sadakane, W.K.Sung: "Constructing Compressed Suffix Arrays with Large Alphabets"Proceedings of International Symposium on Algorithms and Computation(ISAAC). Vol.14. 240-249 (2003)
W.K.Hon、T.W.Lam、K.Sadakane、W.K.Sung:“Constructing compressed Suffix Arrays with Large Alphabets”国际算法与计算研讨会(ISAAC)论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
韓 永楷, 定兼 邦彦, 宋 永健: "全文索引構築のための省スペースなアルゴリズム"情報科学技術レターズ. Vol.2, No.LD-002. 67-68 (2003)
韩永凯、贞兼邦彦、宋永健:“构建全文索引的节省空间算法”,《信息科学与技术快报》,第 2 卷,No.LD-002 (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Constructing Compressed Suffix Arrays with Large Alphabets
- DOI:10.1007/978-3-540-24587-2_26
- 发表时间:2003-12
- 期刊:
- 影响因子:0
- 作者:W. Hon;T. Lam;K. Sadakane;W. Sung
- 通讯作者:W. Hon;T. Lam;K. Sadakane;W. Sung
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
定兼 邦彦其他文献
簡潔データ構造
简洁的数据结构
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
Abou El Hassan W.H.;T. Watanabe and M. R Freeg;定兼 邦彦 - 通讯作者:
定兼 邦彦
定兼 邦彦的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('定兼 邦彦', 18)}}的其他基金
圧縮秘匿計算による大規模データ処理
使用压缩秘密计算进行大规模数据处理
- 批准号:
21H04871 - 财政年份:2021
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Big Data Processing with Compressed Secure Computation
通过压缩安全计算进行大数据处理
- 批准号:
21H05052 - 财政年份:2021
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research (S)
高速ネットワークのための文字列ストリーム処理アルゴリズム
高速网络的字符串流处理算法
- 批准号:
17700019 - 财政年份:2005
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
大量データ処理のための領域効率の良いアルゴリズム
用于处理大量数据的节省空间的算法
- 批准号:
16092222 - 财政年份:2004
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
ゲノム配列の高次圧縮・索引構築と高次幾何構造解析による知識発見
通过基因组序列的高阶压缩和索引构建以及高阶几何结构分析进行知识发现
- 批准号:
14015204 - 财政年份:2002
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
大規模圧縮文書データベースの構築と高度な検索手法に関する研究
大规模压缩文档数据库构建及先进检索方法研究
- 批准号:
13780184 - 财政年份:2001
- 资助金额:
$ 1.28万 - 项目类别:
Grant-in-Aid for Young Scientists (B)