半構造XMLデータからのスキーマ抽出及び変換アルゴリズムの開発

开发半结构化 XML 数据的模式提取和转换算法

基本信息

  • 批准号:
    14780330
  • 负责人:
  • 金额:
    $ 1.98万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2002
  • 资助国家:
    日本
  • 起止时间:
    2002 至 2003
  • 项目状态:
    已结题

项目摘要

本研究のスキーマ抽出は,構造の類似したXMLデータ同士を同じクラスに分類し,同じクラスに属するデータを共通の構造に変換する,という手順で行われる.これを実現するため,本研究では構造の異なる2個のXMLデータを同じ構造に変換(この処理を以下では併合と呼ぶ)するアルゴリズムの開発等を行った(このようなアルゴリズムが得られれば,クラスタリング的手法と本アルゴリズムを組み合わせることによりスキーマ抽出を行うことができる).本研究では,XMLデータをラベル付き順序木とみなす.前年度,報告者は2個のXMLデータを併合するためのアルゴリズムを構成したが,このアルゴリズムでは併合の際に用いる操作が(1)頂点の追加,(2)頂点の削除,(3)頂点のラベルの変更,という3種のものに限定されていた(各操作にはコストが付与される).今年度は,これら3種の操作に加えて(4)部分木の移動,という操作を追加した上で,2個のXMLデータを併合する問題について考察した.本研究で得られた結果は次の通りである.まず,2個のXMLデータおよび操作系列が与えられた場合に,その操作系列をXMLデータに適用して併合を行う多項式時間アルゴリズムを構成した.次に,2個のXMLデータおよび整数Kに対して,それらXMLデータがコストK以下で併合可能か否かを決定する問題がNP完全であることを示した.最後に,「部分木の移動」のコストが移動対象の頂点にのみ依存し,かつ,操作系列に含まれる「部分木の移動」操作の数がある定数以下に抑えられている場合,併合を行うための操作系列でコスト最小のものが多項式時間で得られることを示した.
This study の ス キ ー は マ spare, tectonic の similar し た XML デ ー タ with "を with じ ク ラ ス し に classification, with じ ク ラ ス に genus す る デ ー タ を の tectonic に common variations in す る, と い う hand along the line で わ れ る. こ れ を be presently す る た め, this study で は の different structures な る 2 の XML デ ー タ を じ structures に variations in (こ の 処 を で below は merger と shout ぶ) す る ア ル ゴ リ ズ ム の 発 etc を line っ た (こ の よ う な ア ル ゴ リ ズ ム が have ら れ れ ば, ク ラ ス タ リ ン グ gimmick と this ア ル ゴ リ ズ ム を group み close わ せ る こ と に よ り ス キ ー マ spare line を う こ と が で き る). This study で は, XML デ ー タ を ラ ベ ル pay き order wood と み な す. Before the annual, reporter は 2 の XML デ ー タ を merger す る た め の ア ル ゴ リ ズ ム を constitute し た が, こ の ア ル ゴ リ ズ ム で は merger の interstate に with い る operation が vertex の additional (1), (2) the vertex の pruned, (3) vertex の ラ ベ ル の - more, と い う 3 A <s:1> に に is limited to されて た た(each operation に に コストが コストが is given to される). Three の operation, our は "こ れ ら に plus え て の mobile (4) some wood, と い う operation を additional し た で, 2 の XML デ ー タ を merger す る problem に つ い て investigation し た. This study で have ら れ た results は times の tong り で あ る. ま ず, 2 の XML デ ー タ お よ び operation series が and え ら れ に た situations, そ の operation series を XML デ ー タ に applicable し て merger を line う polynomial time ア ル ゴ リ ズ ム を constitute し た. に, 2 の XML デ ー タ お よ び integer K に し seaborne て, そ れ ら XML デ ー タ が コ ス ト K under で whether merger may か か を decided す る problem が np-complete で あ る こ と を shown し た. Finally に, some wood の mobile の コ ス ト が moving like の seaborne vertex に の み dependent し, か つ, operation series contains に ま れ る part wood の mobile number operation の が あ る destiny the following に え suppression ら れ て い る occasions, merger を line う た め の operation series で コ ス ト minimum の も の が polynomial time で ら れ る こ と を shown し た.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Nobutaka Suzuki: "On Merging Structured Documents with Move Operation"Proceedings of the International Symposium on Information and Communication Technologies (ISICT03). 256-261 (2003)
Nobutaka Suzuki:“论将结构化文档与移动操作合并”信息与通信技术国际研讨会 (ISICT03) 论文集。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鈴木 伸崇其他文献

鈴木 伸崇的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鈴木 伸崇', 18)}}的其他基金

安定マッチングの拡張およびクラウドソーシングのタスク割り当て問題への適用
扩展稳定匹配并将其应用于众包任务分配问题
  • 批准号:
    24K14960
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
グラフデータにおける問合せ式充足可能性問題の計算複雑さおよび判定アルゴリズム
图数据查询可满足性问题的计算复杂度与决策算法
  • 批准号:
    21K11900
  • 财政年份:
    2021
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
XMLデータと正規木文法との間のK最適編集操作列を求めるアルゴリズムの開発
开发一种算法来查找 XML 数据和常规树语法之间的 K 最优编辑操作
  • 批准号:
    18700019
  • 财政年份:
    2006
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
半構造データからのスキーマ情報抽出アルゴリズムの開発
半结构化数据模式信息提取算法的开发
  • 批准号:
    12780317
  • 财政年份:
    2000
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

異なる体格に適合する身体動作タスク等価性評価と動作データ変換への応用
应用于身体运动任务等价性评估及运动数据转换以适应不同体质
  • 批准号:
    24K15061
  • 财政年份:
    2024
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
相互データ変換を行う連成ミドルウェアの開発と応用
数据相互转换耦合中间件的开发与应用
  • 批准号:
    26330147
  • 财政年份:
    2014
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
高速データ変換TPDシステムによる固体表面の酸・塩基性の評価
使用高速数据转换TPD系统评估固体表面的酸度和碱度
  • 批准号:
    07750895
  • 财政年份:
    1995
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
エサキダイオード等による三値変調方式超高速度多重データ変換回路の研究
使用江崎二极管等的三电平调制型超高速复用数据转换电路的研究
  • 批准号:
    X40440-----53416
  • 财政年份:
    1965
  • 资助金额:
    $ 1.98万
  • 项目类别:
    Particular Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了