高度反復データに対する圧縮性指標の研究と圧縮情報処理への応用

高重复数据压缩性指标研究及其在压缩信息处理中的应用

基本信息

  • 批准号:
    22K11907
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

近年,計算機性能やセンシング技術の向上,通信ネットワークの発達などを背景に,計算機上のデータが爆発的に増加している.これらのデータを有効に保存・活用するためには圧縮技術の利用が不可欠だが,一般に可逆圧縮の限界として知られるシャノンの情報量は,繰り返しを多く含むデータの圧縮可能性を適切に捉えられていない.例えば,同一種のDNA配列は個体間で数パーセントの差異しかないため,共通する部分配列を参照しあうことで大幅な圧縮が可能になるが,各塩基の頻度情報のみを利用するエントロピー符号ではほとんど圧縮することができない.近年,このような繰り返しを多く含む高度反復データを対象とした圧縮手法が盛んに研究されている.本研究では,高度反復データが有する圧縮可能性を適切に捉える圧縮性指標に関する研究および圧縮情報処理技術への応用に関する研究を行う.2022年度は,連長圧縮された文字列上で文字列複雑度に基づいた圧縮性指標を効率的に計算する手法について研究を行い,成果をまとめた論文はInternational Symposium on String Processing and Information Retrieval (SPIRE) 2022に採択され発表を行った.現在まで様々な圧縮性指標が提案されているが,文字列複雑度に基づいた圧縮性指標は,効率的に計算できる点,文字列の局所的な変化に対して頑健である点など多くの良い性質を持つ.さらに,文字列複雑度に基づいた圧縮性指標が分かると,そのサイズに基づいた索引構造が効率的に計算できることが知られている.今回の研究成果により,この索引構造がより効率的に構築できるようになることが期待できる.
In recent years, the computer performance and the development of technology, communications and development background, computer data explosion in the development of the increase. In general, the amount of information available for reversible compression is limited to the amount of information available for compression. For example, the DNA alignment of the same species varies from individual to individual, and the common partial alignment is referenced to the frequency information of each base. In recent years, the research on compression techniques has been carried out in a number of ways, including highly repetitive techniques. This study is aimed at the research on compression index and compression information processing technology application related to the possibility of highly repetitive compression. In 2022, the research is aimed at the calculation method of compression index and compression index efficiency on the basis of character string repetition. International Symposium on String Processing and Information Retrieval (SPIRE) 2022 Now, the compression index is proposed, the character string complexity is based on the compression index, the calculation of the efficiency is the point, the character string is based on the transformation of the character string is the point, the number and the good property are maintained. In addition, the text column complex degree base in the compression index is divided into two parts, namely, the base index structure is divided into two parts, namely, the calculation of the efficiency index is divided into three parts, namely, the calculation of the efficiency index is divided into four parts, and the calculation of the efficiency index is divided into four parts. The results of this paper are as follows: 1. The index structure of this paper is based on the structure of efficiency.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Substring Complexities on Run-length Compressed Strings
运行长度压缩字符串的子字符串复杂性
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

井 智弘其他文献

省スペースオンラインLZ分解
节省空间的在线LZ拆装
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takashi Yoshino;Yuki Hayashi;and Yukiko I. Nakano;井 智弘
  • 通讯作者:
    井 智弘
非可逆圧縮データからの高速な画像生成
从有损压缩数据快速生成图像
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    管谷 克彦;高畠 嘉将;井 智弘;申 吉浩;坂本 比呂志
  • 通讯作者:
    坂本 比呂志
耐故障性向上のための脚ロボットの適応歩容生成
腿式机器人的自适应步态生成可提高容错能力
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takashi Yoshino;Yuki Hayashi;and Yukiko I. Nakano;井 智弘;河田 武之,小嶋 勝,前 泰志,新井 健生
  • 通讯作者:
    河田 武之,小嶋 勝,前 泰志,新井 健生
岩石学へのデータ駆動型アプローチ
数据驱动的岩石学方法
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takashi Yoshino;Yuki Hayashi;and Yukiko I. Nakano;井 智弘;河田 武之,小嶋 勝,前 泰志,新井 健生;桑谷立,永田賢二,岡田真人,鳥海光弘
  • 通讯作者:
    桑谷立,永田賢二,岡田真人,鳥海光弘

井 智弘的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('井 智弘', 18)}}的其他基金

BW変換技術の深化による大規模データ処理基盤技術の開発
深化BW转换技术开发大规模数据处理基础技术
  • 批准号:
    19K20213
  • 财政年份:
    2019
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
圧縮文字列上の高速パターン列挙に関する基盤技術開発
压缩字符串高速模式枚举基础技术开发
  • 批准号:
    12J06417
  • 财政年份:
    2012
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了