半構造化文書に対する変換規則の帰納推論
半结构化文档转换规则的归纳推理
基本信息
- 批准号:12780232
- 负责人:
- 金额:$ 1.34万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:2000
- 资助国家:日本
- 起止时间:2000 至 2001
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
半構造化文書のフォーマットであるXMLの登場によって,計算機間で交換されるデータの大部分がXML文書へと移行しつつある.XMLの登場によって,データの解析処理とデータに対する操作が標準化され,各アプリケーション間でデータをやりとりするために必要であった変換操作がXMLに対する操作という統一的な手法によって行うことが可能となった.しかし,XMLではその構造を規定するタグをも自由に定義できるという柔軟性から,XMLの応用は多岐に及び,必要とされる変換すべてを人手によって記述することは現実的に不可能である.本研究は,そのような計算機間で交換される大量のXML文書間の変換を,入力となる文書と出力となる文書だけを具体例として与え,それらの間に必要な変換規則を自動的に推論する手法の開発と,そのために必要な理論の展開を目的とする.XML文書の変換とはあるXML文書の一部を取り出し,新たなXML文書を取り出されたXML文書の一部から再構成することである.ここで重要な問題となるのはXML文書の一部がどのように取り出されているかを推論することである.申請者は,半構造化文書を生垣としてとらえ,生垣上の汎化関係を考えることで,与えられた例の間の共通の構造と同時にXML文書ごとに異なる取り出されるべき部分をとらえることができるということを明らかにした.また,効率よく求めることができる共通の構造として極大共通生垣を提案した.極大共通生垣は文字列上の最長部分文字列を生垣上に自然に拡張したものであり,極大共通生垣を実際のXML文書に対して求めることで高い再現率で情報抽出を行うことが可能であることを示した.
The appearance of XML in semi-structured documents, the exchange of data between computers, most of the XML documents, and the migration of XML. The appearance of XML, the parsing of data, and the operation of data are standardized, and the operation of XML is necessary between each document. XML is not only flexible, but also flexible. XML is not only flexible, but also flexible. In this paper, a large number of XML documents are exchanged between computers, and a part of XML documents is extracted. A new XML document is extracted and reconstructed. A part of the XML document is taken from the important problem. The applicant is a semi-structured document, and the generalization relationship between the two documents is common. The common structure of the structure. The longest part of the text column on the maximum common generation wall is the natural extension of the text column, and the maximum common generation wall is the XML document.
项目成果
期刊论文数量(18)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
福田 賢治: "生垣上の反単一化を用いた情報抽出手法の提案"人工知能学会研究会資料SIG-KBS-A102-9. 47-52 (2001)
Kenji Fukuda:“使用对冲反统一的信息提取方法的提案”人工智能研究小组材料 SIG-KBS-A102-9 47-52 (2001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
岡崎敬士,石野明,竹田正幸,松尾文碩: "科学技術文における共起情報を用いた関連語の抽出"第14回人工知能学会全国大会予稿集. 173-176 (2000)
Takashi Okazaki、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“使用科学和技术句子中的共现信息提取相关词”第 14 届日本人工智能学会全国会议记录(2000 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
藤原飛鳥,石野明,竹田正幸,松尾文碩: "LCSに着目した英文科学技術二次文献からのキーワード抽出"情報処理学会 第62回全国大会予稿集. (2001)
Asuka Fujiwara、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“以 LCS 为中心的英语科技二级文献中的关键词提取”第 62 届日本信息处理学会全国会议论文集(2001 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
福田賢治,石野明,竹田正幸,松尾文碩: "XMLを用いたWebアプリケーションの構築手法の提案"情報処理学会 第62回全国大会予稿集. (2001)
Kenji Fukuda、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“使用 XML 构建 Web 应用程序的方法的提案”第 62 届日本信息处理学会全国会议论文集(2001 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
村上誠,石野明,竹田正幸,松尾文碩: "単語の頻度情報の偏りを用いた文書の自動分類手法の評価"情報処理学会 第62回全国大会予稿集. (2001)
Makoto Murakami、Akira Ishino、Masayuki Takeda、Fumiaki Matsuo:“使用有偏差的词频信息评估自动文档分类方法”第 62 届日本信息处理学会全国会议论文集(2001 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
石野 明其他文献
パスプルーニングと決定性有限オートマトンを用いたストリーム指向のXQuery処理
使用路径修剪和确定性有限自动机的面向流的 XQuery 处理
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
石野 明;他1名 - 通讯作者:
他1名
石野 明的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('石野 明', 18)}}的其他基金
安全な分散型全文検索手法に関する研究
安全分布式全文检索方法研究
- 批准号:
20500083 - 财政年份:2008
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
ストリーム指向の超高速XQuery処理技術に関する研究
面向流的超高速XQuery处理技术研究
- 批准号:
18700092 - 财政年份:2006
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
相似海外基金
MFB: Cracking the codes: understanding the rules of mRNA localization and translation
MFB:破解密码:了解 mRNA 定位和翻译的规则
- 批准号:
2330283 - 财政年份:2024
- 资助金额:
$ 1.34万 - 项目类别:
Standard Grant
REU Site: Quantitative Rules of Life: General Theories across Biological Systems
REU 网站:生命的定量规则:跨生物系统的一般理论
- 批准号:
2349052 - 财政年份:2024
- 资助金额:
$ 1.34万 - 项目类别:
Standard Grant
Rules of life in CO2-driven microbial communities: Microbiome engineering for a Net Zero future
二氧化碳驱动的微生物群落的生命规则:净零未来的微生物组工程
- 批准号:
BB/Y003195/1 - 财政年份:2024
- 资助金额:
$ 1.34万 - 项目类别:
Research Grant
Unravelling the structural rules of antiperovskites and their derivatives
揭示反钙钛矿及其衍生物的结构规则
- 批准号:
23K23045 - 财政年份:2024
- 资助金额:
$ 1.34万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
CAREER: Computing rules of the social brain: behavioral mechanisms of function and dysfunction in biological collectives
职业:社会大脑的计算规则:生物集体中功能和功能障碍的行为机制
- 批准号:
2338596 - 财政年份:2024
- 资助金额:
$ 1.34万 - 项目类别:
Continuing Grant
URoL:ASC: Using Rules of Life to Capture Atmospheric Carbon: Interdisciplinary Convergence to Accelerate Research on Biological Sequestration (CARBS)
URoL:ASC:利用生命规则捕获大气碳:跨学科融合加速生物固存 (CARBS) 研究
- 批准号:
2319597 - 财政年份:2024
- 资助金额:
$ 1.34万 - 项目类别:
Standard Grant
Taming of the Streptomycete: Understanding the rules of domestication in antibiotic-producing bacteria
驯服链霉菌:了解产生抗生素的细菌的驯化规则
- 批准号:
BB/Y00082X/1 - 财政年份:2024
- 资助金额:
$ 1.34万 - 项目类别:
Research Grant
Collaborative Research: URoL:ASC: Applying rules of life to forecast emergent behavior of phytoplankton and advance water quality management
合作研究:URoL:ASC:应用生命规则预测浮游植物的紧急行为并推进水质管理
- 批准号:
2318862 - 财政年份:2023
- 资助金额:
$ 1.34万 - 项目类别:
Standard Grant
Transition: Metabolomics-driven understanding of rules that coordinate metabolic responses and adaptive evolution of synthetic biology chassis
转变:代谢组学驱动的对协调代谢反应和合成生物学底盘适应性进化的规则的理解
- 批准号:
2320104 - 财政年份:2023
- 资助金额:
$ 1.34万 - 项目类别:
Standard Grant
Collaborative Research: RUI: Elucidating Design Rules for non-NRPS Incorporation of Amino Acids on Polyketide Scaffolds
合作研究:RUI:阐明聚酮化合物支架上非 NRPS 氨基酸掺入的设计规则
- 批准号:
2300890 - 财政年份:2023
- 资助金额:
$ 1.34万 - 项目类别:
Continuing Grant














{{item.name}}会员




