Semantic and Contextual Analysis using Common knowledge from Japanese Articles
使用日语文章中的常识进行语义和上下文分析
基本信息
- 批准号:13680461
- 负责人:
- 金额:$ 1.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 2003
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The main aim of the research is to develop a practical semantic analysis system SAGE. For this aim, we attempted to improve the performance both in precision and speed based on the original prototype.In regard to the precision, we made four efforts to improve it. (1) In addition to the statistical measures calculated from the EDR corpus to determine the deep case among words, we supplement a rule-based procedure to determine the case between two words, based on the information on particles, parts of speech, and word meanings. (2) We contrived to determine the deep case between an indeclinable word and its modifier. (3) It has been made possible to analyze the deep case of unregistered words in the EDR Dictionary by replacing them with the registered words holding similar concepts. (4) We classified the expressions containing brackets into 3 categories, supplementation, commission, and complement, and add the analysis of brackets into SAGE.The present system employing the above techniques has reached a precision of 90.2% on word meaning, 90.0% on deep case for the sentences from EDR Corpus, and 87.0% and 86.8% respectively for news articles from the Internet.In regard to the speed-up, we devised a linear-order algorithm including two steps for deciding word meaning and deep case. We first see how the modified word impacts the meaning of the modifier from bottom up, and then represent it with a probability. After that, we determine the meaning of each clause with a top-down approach. We implemented a speed-up of about 10 thousand times with the algorithm. Besides, we reduced the time required for accessing the EDR Dictionary to 1 fifth of the original time, and converted the whole system from a Prolog version to a C version and hence realized another speed-up of 5 times.
本课题的主要目的是开发一个实用的语义分析系统SAGE。为此,我们试图在原有原型的基础上提高精度和速度。在精度方面,我们做了四个方面的努力来提高它。(1)除了从EDR语料库计算的统计措施来确定词之间的深度大小写之外,我们还补充了一个基于规则的过程来确定两个词之间的大小写,基于粒子、词性、字的含义。(2)我们设法确定了一个不可辨别的词和它的修饰词之间的深格。(3)通过用具有类似概念的注册词替换未注册词,可以分析EDR词典中未注册词的深层情况。(4)本文将含有括号的句子分为补充、委托和补充三类,并将括号分析加入到SAGE中,对EDR语料库中的句子进行了语义分析和深格分析,其准确率分别达到90.2%和90.0%。对于互联网上的新闻文章,正确率分别为87.0%和86.8%.在加速方面,我们设计了一种线性排序算法,包括确定词义和深度格两个步骤.我们首先从下往上看修饰词如何影响修饰词的含义,然后用概率表示它。然后,我们用自上而下的方法确定每个子句的含义。我们实现了约1万倍的速度与算法。此外,我们还将EDR字典的访问时间缩短到原来的1/5,并将整个系统从Prolog版本转换为C版本,实现了5倍的速度提升。
项目成果
期刊论文数量(29)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Yamagishi, K., Muramatsu, T., Harada, M.: "Development of demonstrative pronoun resolution system Anasys/D using similarity of word meaning"IPSJ-SIG-Notes. NL-153. 17-23 (2003)
Yamagishi, K.、Muramatsu, T.、Harada, M.:“利用词义相似性开发指示代词解析系统 Anasys/D”IPSJ-SIG-Notes。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Oono, H., Harada, M.: "Proposal of the Case frame expression of complex sentences and enhancing of the semantic analysis system SAGE to complex sentences"Proceedings of the 64^<th> National Conference of Information Processing Society of Japan. No.2. 49-5
Oono, H., Harada, M.:“提出复杂句子的案例框架表达和增强复杂句子的语义分析系统SAGE”第64届日本信息处理学会全国会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
原田実, 田淵和幸, 大野博之: "日本語意味解析システムSAGEの高速化・高精度化とコーパスによる精度評価"情報処理学会論文誌. Vol.43,No.9. 2894-2902 (2002)
Minoru Harada、Kazuyuki Tabuchi、Hiroyuki Ohno:“提高日语语义分析系统 SAGE 的速度和准确性并使用语料库评估准确性”,《日本信息处理学会汇刊》第 43 卷,第 9 期。2894-2902。 (2002)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
大野 博之, 原田 実: "複文の格表現の提案と意味解析システムSAGEの複文への拡張"情報処理学会第64回全国大会論文集. 3M-4. 49-50 (2002)
Hiroyuki Ohno、Minoru Harada:“复杂句子的案例表达式和语义分析系统 SAGE 到复杂句子的扩展”第 64 届日本信息处理学会全国会议记录 3M-4 (2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Minami, A., Harada, M.: "Development of anaphoric analysis system which uses similarity of vocabulary"Proceedings of the 64^<th> National Conference of Information Processing Society of Japan. No.2. 53-54 (2002)
Minami, A., Harada, M.:“利用词汇相似性的照应分析系统的开发”第64届日本信息处理学会全国会议论文集。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
HARADA Minoru其他文献
HARADA Minoru的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('HARADA Minoru', 18)}}的其他基金
Development research of highly accurate Question Answering system doing precise matching of meaning
语义精准匹配的高精度问答系统开发研究
- 批准号:
16500085 - 财政年份:2004
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Research of machine learning of object oriented analysis knowledge by induvtive reasoning
归纳推理面向对象分析知识的机器学习研究
- 批准号:
09680377 - 财政年份:1997
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
A Research of Reverse Engineering Tool which generates a non-procedural specification from COBOL programs
从COBOL程序生成非过程规范的逆向工程工具的研究
- 批准号:
07680434 - 财政年份:1995
- 资助金额:
$ 1.41万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
Computational models of word meaning in use
使用中词义的计算模型
- 批准号:
RGPIN-2019-06917 - 财政年份:2022
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Computational models of word meaning in use
使用中词义的计算模型
- 批准号:
RGPIN-2019-06917 - 财政年份:2021
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Computational models of word meaning in use
使用中词义的计算模型
- 批准号:
RGPIN-2019-06917 - 财政年份:2020
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Computational models of word meaning in use
使用中词义的计算模型
- 批准号:
DGECR-2019-00037 - 财政年份:2019
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Launch Supplement
Computational models of word meaning in use
使用中词义的计算模型
- 批准号:
RGPIN-2019-06917 - 财政年份:2019
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Processing abstract word meaning: Behavioural and neurophysiological investigation
处理抽象词义:行为和神经生理学研究
- 批准号:
426887-2012 - 财政年份:2014
- 资助金额:
$ 1.41万 - 项目类别:
Postgraduate Scholarships - Doctoral
Processing abstract word meaning: Behavioural and neurophysiological investigation
处理抽象词义:行为和神经生理学研究
- 批准号:
426887-2012 - 财政年份:2013
- 资助金额:
$ 1.41万 - 项目类别:
Postgraduate Scholarships - Doctoral
Processing abstract word meaning: Behavioural and neurophysiological investigation
处理抽象词义:行为和神经生理学研究
- 批准号:
426887-2012 - 财政年份:2012
- 资助金额:
$ 1.41万 - 项目类别:
Postgraduate Scholarships - Doctoral
Word meaning and sentence comprehension
词义和句子理解
- 批准号:
155704-2007 - 财政年份:2011
- 资助金额:
$ 1.41万 - 项目类别:
Discovery Grants Program - Individual
Word Meaning: What it is and what it is not.
词义:它是什么,它不是什么。
- 批准号:
AH/I000216/1 - 财政年份:2011
- 资助金额:
$ 1.41万 - 项目类别:
Research Grant














{{item.name}}会员




