Study of index construction and compression algorithms in fully-online setting

全在线环境下索引构建和压缩算法研究

基本信息

  • 批准号:
    21K17817
  • 负责人:
  • 金额:
    $ 2.58万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究は,様々な文字列情報学における問題に対し「どのようにすれば完全オンラインへの拡張が可能か?」を明らかにすることを目標としている.特に,(i)文脈性 (ii)完全オンライン性 (iii) 低メモリ性をもつ索引,すなわち「完全オンライン圧縮文字列索引」の構築を目指している.これを実現するためには,圧縮索引の通常オンライン構築アルゴリズムの開発と,その完全オンライン化の二つのステップが必要である.2022年度は機械学習分野において決定木モデルの列挙構造が動的計画法と同様の構造を持つことを見出し,『羅生門集合』と呼ばれる最適決定木とほとんど同じ精度を持つ決定木の集合を構築するアルゴリズムを初めて与えることに成功した.列挙した決定木は特徴量数の指数個存在する可能性があるため,これを保持するためにはよりコンパクトな索引が必要となる.この課題に対して本研究の圧縮索引構造のアイデアを用いることにより解決することに成功した.羅生門集合は機械学習モデルの説明可能性から近年注目されている概念であり,今後決定木以外のモデルへの拡張が考えられる.また昨年度に引き続き,東北大学のDiptarama Hendrian助教授・九州大学の稲永俊介教授らの協力のもと,昨年度おおむね完成していた最近印付き祖先(Nearest Marked Ancestor)クエリ構造を利用する線形サイズ接尾辞木(Linear-size Suffix Tree)の構築アルゴリズムを精査し具体的な手法を与えることに成功した.
This study is aimed at solving the problem of character string informatics: "How can we solve the problem of complete character string informatics?" The first time I saw him, I saw him. In particular,(i) contextual (ii) completely independent (iii) low-independent index construction refers to the construction of a "completely independent compressed text string index." In 2022, it was necessary to reduce the development of index structure and complete index structure. In 2022, it was necessary to reduce the development of index structure and complete index structure."Rashomon Collection" is the most suitable decision tree. It is the same precision. It is the first decision tree to construct the collection. The index of the characteristic quantity of the column is necessary. This paper presents a method for solving the problem of compression index structure. Rashomon set is a mechanical learning model. It is possible to explain the concept of Rashomon set in recent years. Last year, Diptarama Hendrian Assistant Professor of Tohoku University and Professor Toshisuke Inaga of Kyushu University cooperated with each other. Last year, the Nearest Marked Ancestor was completed. The structure of the tree was used to construct the Linear-size Suffix Tree.

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Counterfactual Explanation Trees: Transparent and Consistent Actionable Recourse with Decision Trees
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kentaro Kanamori;Takuya Takagi;Ken Kobayashi;Yuichi Ike
  • 通讯作者:
    Kentaro Kanamori;Takuya Takagi;Ken Kobayashi;Yuichi Ike
Distribution-Aware Counterfactual Explanation by Mixed-Integer Linear Optimization
通过混合整数线性优化进行分布感知反事实解释
Ordered Counterfactual Explanation by Mixed-Integer Linear Optimization
通过混合整数线性优化进行有序反事实解释
Explainable and Local Correction of Classification Models Using Decision Trees
  • DOI:
    10.1609/aaai.v36i8.20816
  • 发表时间:
    2022-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hirofumi Suzuki;Hiroaki Iwashita;Takuya Takagi;Keisuke Goto;Yuta Fujishige;Satoshi Hara
  • 通讯作者:
    Hirofumi Suzuki;Hiroaki Iwashita;Takuya Takagi;Keisuke Goto;Yuta Fujishige;Satoshi Hara
Exploring the Whole Rashomon Set of Sparse Decision Trees
探索整个罗生门稀疏决策树集
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rui Xin;Chudi Zhong;Zhi Chen;Takuya Takagi;Margo Seltzer;Cynthia Rudin
  • 通讯作者:
    Cynthia Rudin
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

高木 拓也其他文献

機械学習と機械発見:自然科学研究におけるデータ利活用の再考
机器学习和机器发现:重新思考自然科学研究中的数据利用
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金森 憲太朗;高木 拓也;小林 健;有村 博紀;瀧川一学
  • 通讯作者:
    瀧川一学
DAGの簡潔表現について
关于DAG的简洁表达
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高木 拓也;有村 博紀
  • 通讯作者:
    有村 博紀
混合整数線形計画法に基づく実現可能性を考慮した反事実的説明法
基于混合整数线性规划考虑可行性的反事实解释方法
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金森 憲太朗;高木 拓也;小林 健;有村 博紀
  • 通讯作者:
    有村 博紀
低栄養が速筋及び遅筋線維の酸化的リン酸化能に及ぼす影響
营养不良对快肌纤维和慢肌纤维氧化磷酸化能力的影响
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    金森 憲太朗;高木 拓也;小林 健;有村 博紀;平林卓己,宅和美穂,田中稔,近藤浩代,藤野英己
  • 通讯作者:
    平林卓己,宅和美穂,田中稔,近藤浩代,藤野英己
複数テキスト索引構造のオンライン構築
在线构建多种文本索引结构
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高木 拓也;稲永 俊;有村 博紀;Dany Breslauer;Diptarama Hendrian
  • 通讯作者:
    Diptarama Hendrian

高木 拓也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似国自然基金

大规模动态后缀索引的高效率算法研究
  • 批准号:
    61872391
  • 批准年份:
    2018
  • 资助金额:
    63.0 万元
  • 项目类别:
    面上项目
可信云存储高效密文全文检索模型及关键技术研究
  • 批准号:
    61202034
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

SGER: Exploratory Research: Using the Cuberinfrastructure to build a Full Text Index to the Web
SGER:探索性研究:使用 Cuberinfrastruct 构建网络全文索引
  • 批准号:
    0634677
  • 财政年份:
    2006
  • 资助金额:
    $ 2.58万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了