半構造化文書に対する変換規則の帰納推論

半结构化文档转换规则的归纳推理

基本信息

  • 批准号:
    12780232
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    2000
  • 资助国家:
    日本
  • 起止时间:
    2000 至 2001
  • 项目状态:
    已结题

项目摘要

半構造化文書のフォーマットであるXMLの登場によって,計算機間で交換されるデータの大部分がXML文書へと移行しつつある.XMLの登場によって,データの解析処理とデータに対する操作が標準化され,各アプリケーション間でデータをやりとりするために必要であった変換操作がXMLに対する操作という統一的な手法によって行うことが可能となった.しかし,XMLではその構造を規定するタグをも自由に定義できるという柔軟性から,XMLの応用は多岐に及び,必要とされる変換すべてを人手によって記述することは現実的に不可能である.本研究は,そのような計算機間で交換される大量のXML文書間の変換を,入力となる文書と出力となる文書だけを具体例として与え,それらの間に必要な変換規則を自動的に推論する手法の開発と,そのために必要な理論の展開を目的とする.XML文書の変換とはあるXML文書の一部を取り出し,新たなXML文書を取り出されたXML文書の一部から再構成することである.ここで重要な問題となるのはXML文書の一部がどのように取り出されているかを推論することである.申請者は,半構造化文書を生垣としてとらえ,生垣上の汎化関係を考えることで,与えられた例の間の共通の構造と同時にXML文書ごとに異なる取り出されるべき部分をとらえることができるということを明らかにした.また,効率よく求めることができる共通の構造として極大共通生垣を提案した.極大共通生垣は文字列上の最長部分文字列を生垣上に自然に拡張したものであり,極大共通生垣を実際のXML文書に対して求めることで高い再現率で情報抽出を行うことが可能であることを示した.
Half structured document の フ ォ ー マ ッ ト で あ る XML の appearance に よ っ て, で exchange between computer さ れ る デ ー タ の most が XML document へ と transitional し つ つ あ る. XML の appearance に よ っ て, デ ー タ の parsing 処 Richard と デ ー タ に す seaborne る が standardized operation さ れ, each ア プ リ ケ ー シ ョ ン between で デ ー タ を や り と り す る た め に Necessary で あ っ た variations in operating が XML に す seaborne る operation と い う unified な gimmick に よ っ て line う こ と が may と な っ た. し か し, XML で は そ を の structure regulation す る タ グ を も free に definition で き る と い う softness か ら, XML の 応 with は toki に and び, necessary と さ れ る variations in す べ て を manpower に よ っ て account す る こ Youdaoplaceholder0 と the present に is impossible である. This study は そ の よ う な で exchange between computer さ れ る large の の between XML document variations in を, into force と な る documents と output と な る documents だ け を concrete example と し て and え そ れ ら の に な necessary between variations in rule を automatic に inference す る gimmick の open 発 と, そ の た め の に な necessary theory discuss を と す る. XML document の variations in と は あ る XML document の take a を り し, new た な XML document を take り out さ れ た XML document の a か ら reconstitution す る こ と で あ る. こ こ で な important question と な る の は XML document の a が ど の よ う に take り out さ れ て い る か を inference す る こ と で あ る. Applicants は, half structured document を born through と し て と ら え, born on walls の generalization masato is を exam え る こ と で, with え ら れ た の overlap among cases の の tectonic と に XML document at the same time ご と に different な る take り out さ れ る べ き part を と ら え る こ と が で き る と い う こ と を Ming ら か に し た. ま た, sharper rate よ く o め る こ と が で き る の common structure To create と て て, there is a great commonality. Ihara を, proposal た た. Great common living walls は text columns の the longest part of the text columns を through birth に natural に company, zhang し た も の で あ り, born great common walls を be interstate の XML document に し seaborne て o め る こ と で high い reproducibility で intelligence line drew を う こ と が may で あ る こ と を shown し た.

项目成果

期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
福田 賢治: "生垣上の反単一化を用いた情報抽出手法の提案"人工知能学会研究会資料SIG-KBS-A102-9. 47-52 (2001)
Kenji Fukuda:“使用对冲反统一的信息提取方法的提案”人工智能研究小组材料 SIG-KBS-A102-9 47-52 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
岡崎敬士,石野明,竹田正幸,松尾文碩: "科学技術文における共起情報を用いた関連語の抽出"第14回人工知能学会全国大会予稿集. 173-176 (2000)
Takashi Okazaki、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“使用科学和技术句子中的共现信息提取相关词”第 14 届日本人工智能学会全国会议记录(2000 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
藤原飛鳥,石野明,竹田正幸,松尾文碩: "LCSに着目した英文科学技術二次文献からのキーワード抽出"情報処理学会 第62回全国大会予稿集. (2001)
Asuka Fujiwara、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“以 LCS 为中心的英语科技二级文献中的关键词提取”第 62 届日本信息处理学会全国会议论文集(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
福田賢治,石野明,竹田正幸,松尾文碩: "XMLを用いたWebアプリケーションの構築手法の提案"情報処理学会 第62回全国大会予稿集. (2001)
Kenji Fukuda、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“使用 XML 构建 Web 应用程序的方法的提案”第 62 届日本信息处理学会全国会议论文集(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
村上誠,石野明,竹田正幸,松尾文碩: "単語の頻度情報の偏りを用いた文書の自動分類手法の評価"情報処理学会 第62回全国大会予稿集. (2001)
Makoto Murakami、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“使用有偏差的词频信息评估自动文档分类方法”第 62 届日本信息处理学会全国会议论文集(2001 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

石野 明其他文献

セキュアな全文検索手法の提案
一种安全的全文检索方法的提出
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    石野 明;篠原 歩
  • 通讯作者:
    篠原 歩
パスプルーニングと決定性有限オートマトンを用いたストリーム指向のXQuery処理
使用路径修剪和确定性有限自动机的面向流的 XQuery 处理

石野 明的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('石野 明', 18)}}的其他基金

安全な分散型全文検索手法に関する研究
安全分布式全文检索方法研究
  • 批准号:
    20500083
  • 财政年份:
    2008
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
ストリーム指向の超高速XQuery処理技術に関する研究
面向流的超高速XQuery处理技术研究
  • 批准号:
    18700092
  • 财政年份:
    2006
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了