A Metaphoric Search Method for HTML documents
HTML文档的隐喻搜索方法
基本信息
- 批准号:13480086
- 负责人:
- 金额:$ 3.33万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 2003
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Normally, it is troublesome task for users of search engines to represent their intention explicitly beforehand. This is one of major reasons why the search results do not meet user's intention in many cases. Instead of presenting queries describing those intentions precisely, we suppose as a query a pair of an abstract query and its examples. What to be searched is an instance of the abstract one similar to the examples. In other words, our search task is to "find an instance of the abstract one like examples". An HTML document, the object of our search task, can be viewed as a rooted tree of tags with some text contents as its leaves. In order to judge the similarities between text contents and tag structure as well, we consider an ordering on the class of concept graph representations. Both instance generalization relationship and similarity relationship can be defined in terms of the ordering. Based on this fundamental structure of objects for our search problem, we have developed an algorithm to find an instance of abstract query, given its examples. That is, it first computes a set of segments of sentences in text contents from the abstract query Secondly, by matching those text segments, it forms an instance of the query that is a generalization of the given example documents. Finally, any document subsumed by the instance is regarded relevant to the initial query Our experimental result shows that it can compute the generalized document of about 50 sentences within 3 seconds.
通常情况下,搜索引擎的用户要事先明确地表达他们的意图是一件很麻烦的事情。这是搜索结果在许多情况下不符合用户意图的主要原因之一。而不是提出查询描述这些意图精确,我们假设作为一个查询一对抽象的查询和它的例子。所要搜索的是与示例相似的抽象的实例。换句话说,我们的搜索任务是“找到一个抽象的例子”。HTML文档(我们搜索任务的对象)可以被视为标记的根树,其中一些文本内容作为其叶子。为了判断文本内容和标签结构之间的相似性,我们考虑了概念图表示类的排序。实例泛化关系和实例相似关系都可以按照顺序来定义。基于这个基本结构的对象为我们的搜索问题,我们已经开发了一个算法来找到一个实例的抽象查询,给出了它的例子。也就是说,它首先从抽象查询中计算文本内容中的句子片段的集合。其次,通过匹配这些文本片段,它形成查询的实例,该实例是给定示例文档的概括。实验结果表明,该算法可以在3秒内计算出约50个句子的广义文档。
项目成果
期刊论文数量(40)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
原口誠: "概念階層構築における人と機械の違い"人工知能学会誌. 18(5). 537-541 (2003)
Makoto Haraguchi:“概念层次结构中人类与机器的差异”日本人工智能学会杂志 18(5) (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Y.Okubo, Y.Kudoh, M.Haraguchi: "Constructing Appropriate Data Abstractions for Mining Classification Knowledge"Web-Knowledge Management and Decision Support -14th Int'l Conf.on Applications of Prolog, Revised Papers (Springer LNA). 2543. 276-289 (2003)
Y.Okubo、Y.Kudoh、M.Haraguchi:“为挖掘分类知识构建适当的数据抽象”Web 知识管理和决策支持 -第 14 届 Prolog 应用国际会议,修订论文 (Springer LNA)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
角田篤泰, 原口誠: "法的推論と類似性-対話と議論の観点から"人工知能学会誌. 17・1. 14-21 (2002)
Atsushi Tsunoda、Makoto Haraguchi:“法律推理和相似性 - 从对话和讨论的角度”人工智能学会杂志 17・1(2002 年)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Y.Kudo, M.Haraguchi, Y.Okubo: "Data Abstractions for Decision Tree Induction"Theoretical Computer Science. 292(2). 387-416 (2003)
Y.Kudo、M.Haraguchi、Y.Okubo:“决策树归纳的数据抽象”理论计算机科学。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
M.Haraguchi, Y.Kudoh: "Some Criterions for Selecting the Best Data Abstractions""Progress in Discovery Science", Springer LNAI Series of State-of-the-Art Surveys. 2281. 156-167 (2002)
M.Haraguchi、Y.Kudoh:“选择最佳数据抽象的一些标准”“发现科学的进展”,施普林格 LNAI 系列最先进的调查。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
HARAGUCHI Makoto其他文献
HARAGUCHI Makoto的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('HARAGUCHI Makoto', 18)}}的其他基金
Mining Structural Changes
矿业结构变化
- 批准号:
21300047 - 财政年份:2009
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Knowledge Revision Method based on Similarity Observations
一种基于相似性观测的知识修正方法
- 批准号:
11680375 - 财政年份:1999
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
A Case-Based Transformation from HTML documents to XML ones and its Interactive Transformation Support System
基于案例的HTML文档到XML文档的转换及其交互式转换支持系统
- 批准号:
13680440 - 财政年份:2001
- 资助金额:
$ 3.33万 - 项目类别:
Grant-in-Aid for Scientific Research (C)