An Information Retrieval using Conceptual Index Term for Technical Papers
技术论文概念索引词的信息检索
基本信息
- 批准号:09480076
- 负责人:
- 金额:$ 7.1万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1998
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In this research, we proposed a new Information Retrieval (IR) method using semantic information from technical papers. The proposed method is suitable for use in Digital Libraries (DL). Users of Digital Libraries need to retrieve information which meets their semantic requirements. An important problem is the reduction of retrieval errors caused by differences in requests among individual users. To solve this problem, we used some techniques of natural language processing, and dictionaries that describe the relations between words and concepts.To extract semantic information of technical papers, we applied morphological analysis program for text data derived from images of technical papers as OCR results. After morphological analysis, we extract only nouns and examine their distribution of word appearance frequency for later use. We also extract concepts of nouns with EDR concept dictionary and calculate their distribution of concept appearance frequency. Combining the distribution of word appearance frequency and that of concept appearance frequency, we get the concepts which correspond with the subject of technical papers. One of the key ideas of this research is handling concept as concept paths which include the relations among concepts. This helps abstraction of concepts of the subjects of technical paper. Experimental results show effectiveness of the proposed method. We also realized a prototype system of conceptual information retrieval. We focused on technical papers written in Japanese in this paper. As EDR dictionary also has concept dictionary of English words, we can apply our method to technical papers written in English easily. One of the characteristics of EDR concept dictionary is that expression of concepts are in common with Japanese words and English words. This will help cross lingual information retrieval.
在本研究中,我们提出了一种新的信息检索(IR)方法,利用语义信息的技术论文。该方法适用于数字图书馆。数字图书馆的用户需要检索到满足其语义需求的信息。一个重要的问题是减少检索错误所造成的差异,在个别用户的要求。为了解决这一问题,我们使用了自然语言处理技术和描述词与概念之间关系的词典,并对技术论文图像中的文本数据应用形态学分析程序作为OCR结果来提取技术论文的语义信息。形态分析后,我们只提取名词,并检查其分布的单词出现频率为以后使用。利用EDR概念词典提取名词概念,计算概念出现频率的分布。结合词的出现频率分布和概念的出现频率分布,得到与科技论文主题相对应的概念。本研究的核心思想之一是将概念作为概念路径来处理,其中包括概念之间的关系。这有助于科技论文主题概念的抽象。实验结果表明了该方法的有效性。我们还实现了一个概念信息检索的原型系统。我们在这篇论文中重点介绍了用日语撰写的技术论文。由于EDR词典中也有英文单词的概念词典,我们可以很容易地将我们的方法应用到英文科技论文中。EDR概念词典的特点之一是概念的表达方式与日语词汇和英语词汇相同。这将有助于跨语言信息检索。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
C.Horii, M.Imai, K.Chihara: "An Information Retrival using Conceptual Index Term for Technical Pores on Digital Libraries" Proc.of ISDL 97. 205-208 (1997)
C.Horii、M.Imai、K.Chihara:“数字图书馆技术孔概念索引术语的信息检索”Proc.of ISDL 97. 205-208 (1997)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Rei Suzuki, Kideki Sunahara, Masakazu Imai, Kunihiro Chihara: "Building Digital Library System-NAIST Challenge-" Proceedings of International Symposium on Research,Development & Practice in Digital Libraries.(1997)
Rei Suzuki、Kideki Sunahara、Masakazu Imai、Kunihiro Chihara:“构建数字图书馆系统-NAIST挑战-”研究、发展国际研讨会论文集
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
C.Hori, M.Imai and K.Chihara: "Concept Information Retrieval of Technical Papers for Digital Libraries" Proc.Of Advances in Digital Library. (To appear). (1999)
C.Hori、M.Imai 和 K.Chihara:“数字图书馆技术论文的概念信息检索”Proc.Of 数字图书馆进展。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
C.Hori, M.Imai and K.Chihara: "An Information Retrieval using Conceptual Index Term for Technical Paper on Digital Libraries" Proc.Of ISDL'97. 205-208 (1997)
C.Hori、M.Imai 和 K.Chihara:“使用数字图书馆技术论文概念索引术语进行信息检索”Proc.Of ISDL97。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
C.Horii, M.Imai, K.Chihara: "Concepts Information Retrieval of Technical Papers for Digital libraries" Proc. of Advance in Digital Library. (To appear). (1999)
C.Horii、M.Imai、K.Chihara:“数字图书馆技术论文的概念信息检索”Proc。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
NAKAMURA Takayuki其他文献
Sentence Simplification with Core Vocabulary
利用核心词汇简化句子
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto - 通讯作者:
Takumi Maruyama and Kazuhide Yamamoto
複製技術時代の書物のアイデンティティ - 末広鉄腸『二十三年未来記』の場合(上)
复制技术时代的书籍身份——以末广哲的《23年未来记》为例(其一)
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto;SAKUMA Yutaka;SAKUMA Yutaka;佐久間寛;佐久間寛;NAKAMURA Takayuki;NAKAMURA Takayuki;佐久間寛;鈴木広光;佐久間寛;鈴木広光;佐久間寛;鈴木広光;鈴木広光 - 通讯作者:
鈴木広光
活字文献学考:書体意識の生まれるところ
印刷文学研究:字体意识从何而来
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto;SAKUMA Yutaka;SAKUMA Yutaka;佐久間寛;佐久間寛;NAKAMURA Takayuki;NAKAMURA Takayuki;佐久間寛;鈴木広光;佐久間寛;鈴木広光 - 通讯作者:
鈴木広光
複製技術時代の書物のアイデンティティ―末広鉄腸『二十三年未来記』の場合(中)―
复制技术时代书籍的身份:以末广哲町的《23年未来记》为例(中)
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;LOMO MYAZHIOM Agge Celestin;HOSHINO Moriyuki;Takumi Maruyama and Kazuhide Yamamoto;SAKUMA Yutaka;SAKUMA Yutaka;佐久間寛;佐久間寛;NAKAMURA Takayuki;NAKAMURA Takayuki;佐久間寛;鈴木広光;佐久間寛;鈴木広光;佐久間寛;鈴木広光 - 通讯作者:
鈴木広光
Actes du colloque international (Tokyo 22, 23 et 24 aout 2017), Presence africaine: vers de nouvelles perspectives politiques et culturelles: Identites, memoires, resistances entre l'Afrique, l'Europe et les Ameriques de la colonisation a la post-colonie
国际交流行动(2017 年东京 22、23 和 24 日),《非洲的存在:新政治和文化视角:非洲、欧洲和美洲对后殖民地殖民化的身份、回忆录和抵抗》
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
NAKAMURA Takayuki;SAKUMA Yutaka;AGGEE CELESTIN Lomo Myazhiom ?ds. - 通讯作者:
AGGEE CELESTIN Lomo Myazhiom ?ds.
NAKAMURA Takayuki的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('NAKAMURA Takayuki', 18)}}的其他基金
A Cross-linguistic and Cross-regional Study of the Formation of Transatlantic Literature in Paris during the Interwar Period
两次世界大战期间巴黎跨大西洋文学形成的跨语言、跨地域研究
- 批准号:
19K00482 - 财政年份:2019
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Study on Seamless Target Modeling System for Three Dimensional Vision System
三维视觉系统无缝目标建模系统研究
- 批准号:
23500243 - 财政年份:2011
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A TSUNAMI RESONATOR FOR REDUCTION OFFLOOD DAMAGE ALONG INNER BAY OF RIA COAST
用于减少 RIA 海岸内湾洪水损害的海啸谐振器
- 批准号:
22560514 - 财政年份:2010
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Novel Data mining method for next-generation robots
下一代机器人的新型数据挖掘方法
- 批准号:
20500181 - 财政年份:2008
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
PROTECTIVE EFFECT OF HUMAN THIOREDOXIN AGAINST WARM ISCHEMIA REPERFUSION INJURY OF THE LUNG
人硫氧还蛋白对肺热缺血再灌注损伤的保护作用
- 批准号:
17591467 - 财政年份:2005
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A method of spatial arrangement of offshore breakwaters for effective wave attenuation and changing currents
有效衰减波浪和改变水流的近海防波堤空间布置方法
- 批准号:
02650362 - 财政年份:1990
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
A method of spatial array of offshore breakwaters for effective wave attenuation
有效消波的近海防波堤空间阵列方法
- 批准号:
63550376 - 财政年份:1988
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
相似海外基金
The Human Remains: A Digital Library of British Mortuary Science and Investigation
人类遗骸:英国太平间科学与调查数字图书馆
- 批准号:
MR/X023567/1 - 财政年份:2023
- 资助金额:
$ 7.1万 - 项目类别:
Fellowship
Design of disaster prevention education support system based on Tsunami Digital Library
基于海啸数字图书馆的防灾教育支持系统设计
- 批准号:
19K11984 - 财政年份:2019
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The Digital Library of British Mortuary Science & Investigation
英国太平间科学数字图书馆
- 批准号:
MR/S032800/1 - 财政年份:2019
- 资助金额:
$ 7.1万 - 项目类别:
Fellowship
Digital Library Futures: The Impact of E-Legal Deposit in the Academic Sector
数字图书馆的未来:电子缴存对学术界的影响
- 批准号:
AH/P005845/2 - 财政年份:2018
- 资助金额:
$ 7.1万 - 项目类别:
Research Grant
Purchase of Alliance Licences at TIB – SPIE Digital Library (Renewal)
购买 TIB â SPIE 数字图书馆联盟许可证(续订)
- 批准号:
393000538 - 财政年份:2018
- 资助金额:
$ 7.1万 - 项目类别:
Science Communication, Research Data, eResearch (Scientific Library Services and Information Systems)
Digital Library Futures: The Impact of E-Legal Deposit in the Academic Sector
数字图书馆的未来:电子缴存对学术界的影响
- 批准号:
AH/P005845/1 - 财政年份:2017
- 资助金额:
$ 7.1万 - 项目类别:
Research Grant
A Study on Digital Library System for Experimental Information Extraction, Visualization and Recommendation
实验信息提取、可视化和推荐的数字图书馆系统研究
- 批准号:
15H02789 - 财政年份:2015
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ARI-MA: Recasting Nuclear Forensics Discovery as a Digital Library Search Problem
ARI-MA:将核法证发现重塑为数字图书馆搜索问题
- 批准号:
1140073 - 财政年份:2011
- 资助金额:
$ 7.1万 - 项目类别:
Standard Grant
Study on New Digital Library Services Using Document Images and the Web
利用文献图像和网络的新型数字图书馆服务研究
- 批准号:
23700119 - 财政年份:2011
- 资助金额:
$ 7.1万 - 项目类别:
Grant-in-Aid for Young Scientists (B)