半構造XMLデータからのスキーマ抽出及び変換アルゴリズムの開発

开发半结构化 XML 数据的模式提取和转换算法

基本信息

  • 批准号:
    14780330
  • 负责人:
  • 金额:
    $ 1.98万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

本研究のスキーマ抽出は,構造の類似したXMLデータ同士を同じクラスに分類し,同じクラスに属するデータを共通の構造に変換する,という手順で行われる.これを実現するため,本研究では構造の異なる2個のXMLデータを同じ構造に変換(この処理を以下では併合と呼ぶ)するアルゴリズムの開発等を行った(このようなアルゴリズムが得られれば,クラスタリング的手法と本アルゴリズムを組み合わせることによりスキーマ抽出を行うことができる).本研究では,XMLデータをラベル付き順序木とみなす.前年度,報告者は2個のXMLデータを併合するためのアルゴリズムを構成したが,このアルゴリズムでは併合の際に用いる操作が(1)頂点の追加,(2)頂点の削除,(3)頂点のラベルの変更,という3種のものに限定されていた(各操作にはコストが付与される).今年度は,これら3種の操作に加えて(4)部分木の移動,という操作を追加した上で,2個のXMLデータを併合する問題について考察した.本研究で得られた結果は次の通りである.まず,2個のXMLデータおよび操作系列が与えられた場合に,その操作系列をXMLデータに適用して併合を行う多項式時間アルゴリズムを構成した.次に,2個のXMLデータおよび整数Kに対して,それらXMLデータがコストK以下で併合可能か否かを決定する問題がNP完全であることを示した.最後に,「部分木の移動」のコストが移動対象の頂点にのみ依存し,かつ,操作系列に含まれる「部分木の移動」操作の数がある定数以下に抑えられている場合,併合を行うための操作系列でコスト最小のものが多項式時間で得られることを示した.
这项研究中的架构提取是通过将具有相似结构的XML数据分类为同一类而进行的,并将属于同一类的数据转换为共同结构。为了实现这一目标,在这项研究中,我们开发了一种算法,该算法将两个具有不同结构的XML数据转换为相同的结构(以下称为合并)(如果获得了这种算法,则可以通过将群集方法与此算法结合方法来执行架构提取)。在这项研究中,我们认为XML数据标记为订单树。在上一年中,记者构建了一种用于合并两个XML数据的算法,但是在此算法中,合并中使用的操作仅限于三种类型:(1)添加顶点,(2)删除顶点,(3)(3)更改Vertices标签(每种操作限制为三种操作)(每种操作均限制了二英语)。在本研究中获得的结果(4)在添加了两个XML数据和一个多项式算法的情况下,将其运用到XML数据中,我们表明了两个XML数据,该数据是在XML数据中添加的,该数据是在两个XML数据中,在此XML数据中,该数据是XML的数据,该数据是XML的数据,该数据是在XML数据中,该数据是在两个XML数据上,该数据是在XML数据上, “移动子树”仅取决于运动目标的顶点,如果操作系列中包含的“移动子树”操作的数量仅限于一定的常数或更小时,则可以在多项式时间中获得操作序列的最低成本。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Nobutaka Suzuki: "On Merging Structured Documents with Move Operation"Proceedings of the International Symposium on Information and Communication Technologies (ISICT03). 256-261 (2003)
Nobutaka Suzuki:“论将结构化文档与移动操作合并”信息与通信技术国际研讨会 (ISICT03) 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鈴木 伸崇其他文献

鈴木 伸崇的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鈴木 伸崇', 18)}}的其他基金

安定マッチングの拡張およびクラウドソーシングのタスク割り当て問題への適用
扩展稳定匹配并将其应用于众包任务分配问题
  • 批准号:
    24K14960
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
グラフデータにおける問合せ式充足可能性問題の計算複雑さおよび判定アルゴリズム
图数据查询可满足性问题的计算复杂度与决策算法
  • 批准号:
    21K11900
  • 财政年份:
    2021
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
XMLデータと正規木文法との間のK最適編集操作列を求めるアルゴリズムの開発
开发一种算法来查找 XML 数据和常规树语法之间的 K 最优编辑操作
  • 批准号:
    18700019
  • 财政年份:
    2006
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
半構造データからのスキーマ情報抽出アルゴリズムの開発
半结构化数据模式信息提取算法的开发
  • 批准号:
    12780317
  • 财政年份:
    2000
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

図書館資料活用データの学校間共有:教材選択の最適化支援と情報格差の是正
校际共享图书馆资源使用数据:优化教材选择,纠正信息差异
  • 批准号:
    24K06342
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
制約付き固有値問題に基づく局所潜在空間生成とその大規模分散データ解析への応用
基于约束特征值问题的局部潜在空间生成及其在大规模分布式数据分析中的应用
  • 批准号:
    23K28101
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
超大規模データから流体制御に有意な因果関係を導くデータ駆動科学的手法の構築
建立数据驱动的科学方法,从超大规模数据中得出流体控制中的重要因果关系
  • 批准号:
    24K17443
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
地上の実験データと整合した天体内原子核物質の有限温度状態方程式の構築
构建与地面实验数据一致的天文核材料有限温度状态方程
  • 批准号:
    24K07012
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
任意キーに基づくデータ検索・配信が可能な非集中型データ共有ネットワーク
去中心化的数据共享网络,允许基于任意密钥的数据搜索和分发
  • 批准号:
    23K28081
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了