Data Compression: theoretical and practical approaches to the smallest grammar problem

数据压缩:解决最小语法问题的理论和实践方法

基本信息

  • 批准号:
    21K11745
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究は,可逆的データ圧縮の代表例である文法圧縮に対して,理論と応用の両面から取り組んでいる.今年度は関連する文字列処理に関して様々な進展があった.文字の置換を許容して構造の一致を見つけ出すパラメータ化パターン照合問題に関して2つのアプローチを行った.まず,検索を高速化するために,有向非巡回文字列グラフ(DAWG)を拡張した索引構造を新たに提案し,それをテキストから効率よく構築するアルゴリズムを開発した.このアルゴリズムはテキストの末尾に文字を付加した場合にも索引の更新が容易なオンライン型となっている.またこの索引構造を活用することで,検索の対象となるパターンの前後に新たな文字列を付加した場合にその変更に追随しながら効率よくパラメータ化照合ができることを示した.第2のアプローチとして,可逆的データ圧縮で重要な働きをするBurrow-Wheeler変換(BW変換)について,パラメータ化に拡張したBW変換を効率よく行えるアルゴリズムを開発した.このアルゴリズムもオンライン型である.さらに,パラメータ化照合や順序保存照合を含む,より一般化した枠組みにおいて,高速に検索を行うことのできる汎用の並列照合アルゴリズムを開発することに成功した.一方,通常の文字列照合に用いられる索引構造であるポジションヒープに関して,索引構造から元の文字列を復元する「逆問題」の解析に取り組んだ.索引構造に文字ラベルや頂点番号がすべて付与されている場合だけではなく,それらが隠蔽された種々の設定においても,効率よく復元が行えることを示した.
In this study, a representative example of reversible compression is presented. This year's related text processing progress The permutations of characters are allowed to be consistent with the structure of the text. A new index structure is proposed for a non-circulating text column (DAWG). The index can be updated easily when the text is added to the end of the index. The index structure is used to search for the image before and after the new text column is added to the case. Second, reversible compression is important. Burrow-Wheeler conversion (BW conversion) is important. This is the first time I've ever seen you. In addition, the system has been successfully developed by generalizing the combination of sequential storage and combination of high-speed search and common use. In one case, the index structure of the text string is usually used for the combination of the text string and the index structure is used for the combination of the text string and the element. Index structure: text, vertex, sign, assignment, assignment.

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Parameterized DAWGs: Efficient constructions and bidirectional pattern searches
参数化 DAWG:高效构造和双向模式搜索
  • DOI:
    10.1016/j.tcs.2022.09.008
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    1.1
  • 作者:
    Katsuhito Nakashima;Noriki Fujisato;Diptarama Hendrian;Yuto Nakashima;Ryo Yoshinaka;Shunsuke Inenaga;Hideo Bannai;Ayumi Shinohara;Masayuki Takeda
  • 通讯作者:
    Masayuki Takeda
Computing the Parameterized Burrows-Wheeler Transform Online
在线计算参数化 Burrows-Wheeler 变换
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hashimoto Daiki;Hendrian Diptarama;Koeppl Dominik;Yoshinaka Ryo;Shinohara Ayumi
  • 通讯作者:
    Shinohara Ayumi
Efficient Construction of Cryptarithm Catalogues over Deterministic Finite Automata
确定性有限自动机上密码目录的高效构建
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Koya Watanabe;Diptarama Hendrian;Ryo Yoshinaka;Takashi Horiyama and Ayumi Shinohara
  • 通讯作者:
    Takashi Horiyama and Ayumi Shinohara
EMOW型ポジションヒープの逆問題
EMOW类型位置堆的逆问题
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Miyagishi Hiroko;Tsuji Minoru;Miyagawa Kazuya;Kurokawa Kazuhiro;Mochida-Saito Atsumi;Takahashi Kohei;Kosuge Yasuhiro;Ishige Kumiko;Takeda Hiroshi;熊谷 滉士郎,ディプタラマ ヘンリアン,吉仲 亮,篠原 歩
  • 通讯作者:
    熊谷 滉士郎,ディプタラマ ヘンリアン,吉仲 亮,篠原 歩
Inside-Outside Algorithm for Macro Grammars
宏语法的内部-外部算法
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ryuta Kambe;Naoki Kobayashi;Ryosuke Sato;Ayumi Shinohara;Ryo Yoshinaka
  • 通讯作者:
    Ryo Yoshinaka
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

篠原 歩其他文献

Algorithmic Learning Theory with Elementary Formal Systems
具有基本形式系统的算法学习理论
  • DOI:
  • 发表时间:
    1992
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Arikawa;有川 節夫;S. Miyano;宮野 悟;A. Shinohara;篠原 歩;T. Shinohara;篠原 武;Akihiro Yamamoto;山本 章博
  • 通讯作者:
    山本 章博
Learnability of Subsequence Languages
后续语言的可学习性
  • DOI:
  • 发表时间:
    1996
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松本 哲志;篠原 歩
  • 通讯作者:
    篠原 歩
セキュアな全文検索手法の提案
一种安全的全文检索方法的提出
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石野 明;篠原 歩
  • 通讯作者:
    篠原 歩
パラメタ化パターン照合のための索引グラフ構造
用于参数化模式匹配的索引图结构
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中島 克仁;藤里 法輝;ディプタラマ ヘンリアン;中島 祐人;吉仲 亮 ;稲永 俊介;坂内 英夫;篠原 歩;竹田 正幸
  • 通讯作者:
    竹田 正幸
Learning Elementary Formal Systems and an Application to Discovering Motifs in Proteins
学习基本形式系统和发现蛋白质基序的应用
  • DOI:
  • 发表时间:
    1991
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Miyano;宮野 悟;A. Shinohara;篠原 歩;T. Shinohara;篠原 武
  • 通讯作者:
    篠原 武

篠原 歩的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('篠原 歩', 18)}}的其他基金

非明示的表現に対するアルゴリズムの開発
隐式表示算法的开发
  • 批准号:
    16092220
  • 财政年份:
    2004
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
文字列集合からの高速パターン抽出アルゴリズムの開発と実働化
字符串集高速模式提取算法的开发与实现
  • 批准号:
    14780226
  • 财政年份:
    2002
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
遺伝子ネットワークの解析と可視化システムの開発
基因网络分析与可视化系统开发
  • 批准号:
    13208025
  • 财政年份:
    2001
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
遺伝子ネットワークの解析と可視化システムの開発
基因网络分析与可视化系统开发
  • 批准号:
    12208036
  • 财政年份:
    2000
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)
探索アルゴリズムの理論とその実働化に関する研究
搜索算法理论及其实际应用研究
  • 批准号:
    11780278
  • 财政年份:
    1999
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
領域予測のための機械発見システムの研究
区域预测机器发现系统研究
  • 批准号:
    09272219
  • 财政年份:
    1997
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
発見的探索アルゴリズムの理論と実働化
启发式搜索算法的理论与实际应用
  • 批准号:
    09780344
  • 财政年份:
    1997
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
機械学習と機械発見による生物情報の概念形成
通过机器学习和机器发现形成生物信息的概念
  • 批准号:
    08283217
  • 财政年份:
    1996
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
発見的探索アルゴリズムの理論と実働化
启发式搜索算法的理论与实际应用
  • 批准号:
    08780366
  • 财政年份:
    1996
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
確率論的近似学習と計算論的教示の理論
概率近似学习理论与计算教学
  • 批准号:
    07780334
  • 财政年份:
    1995
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

動的文字列処理に対するアルゴリズム技法の開発と計算限界の解明
动态字符串处理算法技术的开发和计算限制的阐明
  • 批准号:
    22K21273
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
編集操作に対応した動的な文字列処理アルゴリズムの開発
开发支持编辑操作的动态字符串处理算法
  • 批准号:
    20J21147
  • 财政年份:
    2020
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ストリーミングモデルにおける文字列処理アルゴリズム基盤
流模型中的字符串处理算法基础
  • 批准号:
    17H06923
  • 财政年份:
    2017
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
ディスレクシア児評価のための、事象関連電位による文字列処理の習熟度評価法の開発
开发使用事件相关电位的字符串处理能力评估方法来评估患有阅读障碍的儿童
  • 批准号:
    17J03889
  • 财政年份:
    2017
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
巨大データからの知識発見を可能にする圧縮文字列処理基盤技術
压缩字符串处理平台技术,实现海量数据知识发现
  • 批准号:
    13J04937
  • 财政年份:
    2013
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ハードウェア化に適した文字列処理アルゴリズムの開発
开发适合硬件实现的字符串处理算法
  • 批准号:
    17700020
  • 财政年份:
    2005
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
半構造化データに対する文字列処理の高速化に関する研究
加速半结构化数据字符串处理的研究
  • 批准号:
    14780224
  • 财政年份:
    2002
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
データ圧縮に基づく文字列処理の高速化に関する研究
基于数据压缩的加速字符串处理的研究
  • 批准号:
    00J00410
  • 财政年份:
    2000
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了