A study on multi-Iingual information retrieval with structured index

结构化索引多语言信息检索研究

基本信息

  • 批准号:
    11680432
  • 负责人:
  • 金额:
    $ 2.43万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    1999
  • 资助国家:
    日本
  • 起止时间:
    1999 至 2001
  • 项目状态:
    已结题

项目摘要

In this research, we have investigated the potentiality of a novel information retrieval method which is named "Structured Index." In this method, we generate an index represented in a binary-tree structure, which is created through a dependency analysis between words that compose titles of scientific papers. This method is expected to outperform conventional keyword-based information retrieval methods, because this index would be more appropriate for matching to the intention embedded in users' queries. Furthermore, this method can be more suitable for cross-lingual information retrieval since index is more concept-oriented. Firstly, we made a fundamental software system with Japanese language morphological analysis of paper titles and dependency analysis between words. Based on these analyzes, we investigated (1) a method appropriate for index structuring, and (2) a general algorithm for retrieval processing. After these preliminary works, we have made a practical retrieval software … More system which was applied to one of the largest Japanese test collections, NTCIR. We made a structured index for title and abstract fields and the evaluation has shown that our new method outperforms conventional methods. We also designed an approach to apply our method to English information retrieval. In terms of cross-lingual information retrieval, another method "Relevance Superimposition (RS) Model" that we also have proposed concurrently has shown better performance, and we decided to choose RS model for our cross-lingual information retrieval. Experiments on the test collections have shown that our system achieved better retrieval performance in both Japanese and English collections. The software we have implemented is composed of two parts, i. e., the language-independent part and the language-dependent part. This structure is better for further development of functionality enhancement for other languages. We also made a web-base user interface of information retrieval for the demonstration of our research achievements. Less
在本研究中,我们探讨了一种新的信息检索方法的潜力,它被命名为“结构化索引”。“在这种方法中,我们生成一个以二叉树结构表示的索引,该索引是通过对组成科学论文标题的单词之间的依赖关系进行分析而创建的。这种方法有望优于传统的基于关键字的信息检索方法,因为这种索引将更适合于匹配嵌入在用户的查询的意图。此外,由于索引更面向概念,该方法更适合于跨语言信息检索。首先,我们制作了一个基本的日文论文标题词法分析和词与词之间依存关系分析的软件系统。基于这些分析,我们研究了(1)适合于索引结构的方法,以及(2)检索处理的通用算法。经过这些前期工作,我们制作了一个实用的检索软件 ...更多信息 该系统被应用于日本最大的测试集合之一,NTCIR。我们为标题和摘要字段建立了一个结构化的索引,评价表明,我们的新方法优于传统的方法。我们还设计了一个方法,将我们的方法应用到英语信息检索。在跨语言信息检索方面,我们同时提出的另一种方法“相关叠加(RS)模型”表现出更好的性能,我们决定选择RS模型进行跨语言信息检索。在测试集上的实验表明,我们的系统在日语和英语集合中取得了更好的检索性能。我们所实现的软件由两部分组成,一是软件的开发。例如,语言独立部分和语言依赖部分。这种结构更适合于进一步开发其他语言的功能增强。我们还制作了一个基于Web的信息检索用户界面,用于展示我们的研究成果。少

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Matsumura, Atsushi: "The Effect of Information Retrieval Method Using Dependency Relationship Between Words"Conference Proceedings of RIAO2000, Paris, France. 1043-1058 (2000)
Matsumura, Atsushi:“利用词间依赖关系的信息检索方法的效果”RIAO2000 会议论文集,法国巴黎。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松村 敦: "情報検索における単語間の関係の効果"情報処理学会データベース研究会資料. 125-34. 683-691 (2001)
Atsushi Matsumura:“信息检索中单词之间关系的影响”日本信息处理协会数据库研究小组材料 125-34(2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松村 敦: "全文検索における構造化インデクスの性能評価"情報処理学会研究報告. 2000-DBS-1 22. 353-360 (2000)
Atsushi Matsumura:“全文搜索中结构化索引的性能评估”日本信息处理协会研究报告 2000-DBS-1 22. 353-360 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松村敦: "単語間の順序付共起関係と係受け関係を用いた抄録検索"情報処理学会第60回全国大会. 3U-7. (2000)
Atsushi Matsumura:“使用单词之间的有序共现关系和依赖关系进行摘要搜索”,第 60 届日本信息处理学会全国会议(2000 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Matsumura, Atsushi: "Effect of Dependency Relationship and Ordered Co-occurrence of Words on Japanese Information Retrieval"The Proceedings of Fifth International Workshop on Information Retrieval with Asian Languages IRAL2000, Hong Kong. 199-200 (2000)
Matsumura,Atsushi:“依存关系和单词有序共现对日语信息检索的影响”,第五届亚洲语言信息检索国际研讨会 IRAL2000,香港。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

ADACHI Jum其他文献

ADACHI Jum的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了