Natural language processing and Improvement of full text retrieval
自然语言处理和全文检索的改进
基本信息
- 批准号:09680393
- 负责人:
- 金额:$ 0.7万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:1997
- 资助国家:日本
- 起止时间:1997 至 1999
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
So far in the full text information retrieval, query condition has been Boolean of words or proximity of two words. The aim of our research is to make possible to use modifier-modifee relation in query to improve the precision rate. For this purpose, we develop Japanese BUNSETSU analysis system (i.e. morphological analysis system) and modifier-modifiee relation analysis system(i.e. syntactic analisys system). They are integrated into the system on PC named IBUKI. The accuracy of IBUKI is more than 99% in BUNSETSU analysis and about 90% in modifier-modifee analysis. To improve its accuracy further we are now developing compound word analysis module based on automaton formulalization and developing a new idea of function words dictionary which registers almost all function words sequence appeared in BUNSETSU. As for retrieval system, we have builet systems for patent documents, news paper articles and example sentence collection in Japanese-English dictionary. By using modifier-modifee condition, retrieval precision was shown to be improved from 84% to 96% in comparison with proximity condition.
在目前的全文信息检索中,查询条件一直是词的布尔型或词的接近度。我们的研究目的是使修改者-修改者关系在查询中的使用成为可能,以提高查准率。为此,我们开发了日语文句分析系统(即词法分析系统)和修饰语-被修饰语关系分析系统(即句法分析系统)。它们被集成到名为IBUKI的PC上的系统中。IBUKI法在文色法分析中的准确率大于99%,在修饰剂-修饰剂法分析中的准确率约为90%。为了进一步提高其准确性,我们正在开发基于自动机公式化的复合词分析模块,并开发了一种新的虚词词典的想法,它几乎记录了所有出现在BUNSETSU中的虚词序列。在检索系统方面,我们建立了专利文献、新闻论文和日英词典例句收集系统。与邻近条件相比,使用修饰-修饰条件,检索精度从84%提高到96%。
项目成果
期刊论文数量(27)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M. Wakata, Y. Hyodo, T. Ikeda: "The Dependency Analysis of a Long Japanese Sentence -On a Scope of "wa" and a scope of an adnominaladnominal embedded structure -"Technical Report of IPSJ. NL130-9. 65-72 (1999)
M. Wakata、Y. Hyodo、T. Ikeda:“日语长句的依存分析 - 关于“wa”的范围和主词嵌入结构的范围 -”IPSJ 的技术报告。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
兵藤安昭, 池田尚志: "文節単位のコスト最小法による日本語形態素解析" 電子情報通信学会言語理解とコミュニケーション研究会. NLC98-2. 9-14 (1998)
Yasuaki Hyodo,Takashi Ikeda:“使用子句成本最小化方法的日语形态分析”IEICE 语言理解和交流研究组(1998)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
池田尚志: "助詞「は」と「が」の認識"言語・認識・表現研究会(LA-CE). 2. 61-80 (1997)
Naoshi Ikeda:“助词‘wa’和‘ga’的识别”语言、认知和表达研究小组 (LA-CE)。 2. 61-80 (1997)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
K. Niimi, Y. Hyodo, T. Ikeda: "Full-text retrieval using dependency structure and its evaluation"Digital Libraries. vol-11. 27-34 (1998)
K. Niimi、Y. Hyodo、T. Ikeda:“使用依赖结构的全文检索及其评估”数字图书馆。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Y.Hyodo, K.Niimi, T.Ikeda: "Conparison between proximity operation and dependency operation in Japanese full text cetrienal" Prov.of the 21st Annical International ACM SIGIR Condence. sigzR'98. 341-342 (1998)
Y.Hyodo、K.Niimi、T.Ikeda:“日语全文 cetrienal 中邻近操作和依赖操作的比较”Prov.of the 21st Annical International ACM SIGIR Condence。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
IKEDA Takashi其他文献
IKEDA Takashi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('IKEDA Takashi', 18)}}的其他基金
Vibrations and Their Control in Floating Offshore Wind Turbines
浮动式海上风力发电机的振动及其控制
- 批准号:
17K06229 - 财政年份:2017
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Towards a new conceptualization of personhood: From the perspective of philosophy of inter-dependency.
迈向人格的新概念:从相互依存哲学的角度来看。
- 批准号:
24720001 - 财政年份:2012
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
A neural model of color harmony
色彩和谐的神经模型
- 批准号:
23700314 - 财政年份:2011
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
A Study on Internal Resonances of Liquid Sloshing in Rigid Tanks
刚性罐内液体晃动内共振研究
- 批准号:
22560225 - 财政年份:2010
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Study of Machine Translation System using Pattern-transform method with deep linguistic knowledge
具有深厚语言知识的模式转换方法的机器翻译系统研究
- 批准号:
19500119 - 财政年份:2007
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Study on Vibration Suppression of Elastic Structures by Sloshing in Multiple Liquid-Filled Containers
多个充液容器中弹性结构晃动抑制振动的研究
- 批准号:
18560231 - 财政年份:2006
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
The development of the audiometer to estimate the listening ability of speech formants.
开发听力计来评估语音共振峰的听力能力。
- 批准号:
14550394 - 财政年份:2002
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Study on Nonlinear Random Vibrations of Structures Carrying Liquid Tanks
液罐运载结构非线性随机振动研究
- 批准号:
12650230 - 财政年份:2000
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
RESEARCH AND DEVELOPMENT OF PRACTICAL HEARING AIDS FOR TELEPHONIC SPEECH WITH A SMALL NON-LINEAR DISTORTION
小非线性失真电话语音实用助听器的研制
- 批准号:
10555130 - 财政年份:1998
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (B).
Study on Nonlinear Vibrations of Structures Carrying Liquid Tanks
液罐运载结构非线性振动研究
- 批准号:
10650244 - 财政年份:1998
- 资助金额:
$ 0.7万 - 项目类别:
Grant-in-Aid for Scientific Research (C)