融合语义信息的句法分析统计模型研究
项目介绍
AI项目解读
基本信息
- 批准号:61562034
- 项目类别:地区科学基金项目
- 资助金额:38.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:吴京慧; 徐慧植; 骆斯文; 李季; 焦贤沛; 万弘晖; 刘威;
- 关键词:
项目摘要
Syntactic structures are unities of semantic contents and syntactic forms. The syntactic structures are not only needed to be analyzed for forms, but also needed to be analyzed for various semantics. The semantic analysis for syntactic structures is more profound and more comprehensive; the possible that give scientific and rational explanations for various phenomena of syntactic forms is more likely. Existing Chinese syntax and semantics analysis methods and existing semantic role labeling system are not suitable for the features of Chinese, and they do not effectively characterize the essential features of Chinese, thus bring about that the performances of syntactic parsing and semantic role labeling of Chinese are far below the performances of English. In Chinese, valence structures can well characterize syntactic structures and semantic constitution relationships of Chinese sentences, so this project will explore the semantic role labeling fusing valence information and the methods of semantic relation analysis based on the studying of related theories of valence grammar, and established a joint syntactic and semantic parsing model: the labeling and parsing of semantic information are carried on during the process of syntactic parsing; and simultaneously the labeled semantic information is integrated in the probability calculations of rules. The problem of data sparseness is another important factor that severely affects the system performances of syntactic parsing, this project will also explore the word clustering models and algorithms based on semantic relations to solve the data sparseness problem of statistical models, and to significantly enhance the system performances of syntactic parsing.
句法结构是语义内容和句法形式的统一体。对句法结构不仅要做形式分析,而且还要做种种语义分析,对句法结构的语义分析越深刻、越全面,就越有可能对句法形式上的各种现象给以科学合理的解释。现有的汉语句法语义分析方法和语义角色标注体系不适合汉语的特点,没有有效刻画出汉语的本质特性,导致目前汉语句法分析和语义角色标注性能与英语相比相差较大。在汉语中,配价结构可以较好地刻画汉语句子的句法结构和语义构成关系,因此本项目将在考察和研究配价语法相关理论基础上,探索融合配价信息的语义角色标注和语义关系分析方法,并在此基础上建立句法分析与语义角色标注联合学习模型:在句法分析的过程中,进行语义信息标注及分析;同时将标注的语义信息融入产生式的概率计算。数据稀疏问题是另一个严重影响句法分析系统性能的重要因素, 本项目将探索基于语义关系的词聚类模型和算法,解决统计模型数据稀疏问题, 较大幅度地提高句法分析系统性能。
结项摘要
句法结构是语义内容和句法形式的统一体。对句法结构不仅要做形式分析,例如句型分析、句法关系分析以及句法层次分析等,而且还要做种种语义分析。对句法结构的语义分析越深刻、越全面,就越有可能科学合理地解释句法形式上的各种现象。本项目重点探索融合语义信息的句法分析统计模型,建立句法分析与语义角色标注联合学习模型,针对汉语的特点以及汉语句法分析的难点,面向理论和实际应用,提出了一些新的句法语义理论、计算模型和方法:. 1.基于词类的语言统计模型是解决数据稀疏问题的主要方法之一。本项目提出了基于词相似度的词聚类算法。实验结果表明,该词聚类算法执行效率高、聚类效果较好: 常规贪婪聚类方法如布朗词聚类算法的困惑度为278,而基于词相似度的词聚类算法和基于语义相似度的词聚类算法的困惑度分别为213,209.3. 根据该词聚类模型的结果所构造的基于词类和基于词语的线性插值模型,对缓解统计语言模型中的数据稀疏问题起到了比较好的作用。. 2.汉语配价结构可以较好地刻画汉语句子的句法结构和语义构成关系,因此,我们在考察配价语法的基础上适当修改了语义角色标注体系并将谓词本身的配价信息融入语义角色标注。实验结果表明, 配价信息的使用能够较大幅度提高动名词性谓词的语义角色标注性能:基于正确句法树和正确谓词识别, 动词性谓词的SRL性能F1值达到93.69%;名词性谓词的SRL性能F1值达到79.23% ;均优于目前国内外的同类系统。. 3.本项目建立了一种基于语义类的句法分析与语义角色标注联合学习模型:在句法分析的过程中,进行语义信息标注及分析;同时将标注的语义信息融入产生式的概率计算。句法分析实验结果表明,基于语义类的并融合配价信息的句法分析与语义角色标注联合学习模型,其精确率和召回率分别为88.73%和88.26%,综合指标F值比著名的中心词驱动句法分析模型提高了8.39个百分点。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(2)
专利数量(0)
几种基于统计的词聚类方法比较
- DOI:--
- 发表时间:2016
- 期刊:中南大学学报(自然科学版)
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
Smooth Methods in Head-Driven Statistical Models for Parsing
用于解析的头驱动统计模型中的平滑方法
- DOI:10.1080/09296174.2019.1611000
- 发表时间:2019-07
- 期刊:Journal of Quantitative Linguistics
- 影响因子:1.4
- 作者:Lichi Yuan
- 通讯作者:Lichi Yuan
A New Word Clustering Algorithm Based on Word Similarity
一种基于词相似度的词聚类新算法
- DOI:10.1049/cje.2017.09.016
- 发表时间:2017-11
- 期刊:Chinese Journal of Electronics
- 影响因子:1.2
- 作者:YUAN Li-chi
- 通讯作者:YUAN Li-chi
利用配价信息的语义角色标注
- DOI:--
- 发表时间:--
- 期刊:电子学报
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
融合语义类信息的句法分析统计模型
- DOI:--
- 发表时间:--
- 期刊:数据采集与处理
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
一种基于互信息的词聚类算法
- DOI:--
- 发表时间:--
- 期刊:系统工程
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
基于依存关系的句法分析统计模型
- DOI:--
- 发表时间:--
- 期刊:中南大学学报(自然科学版)
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
中心词驱动句法分析中的平滑技术
- DOI:--
- 发表时间:2013
- 期刊:电子学报
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
基于改进的隐马尔科夫模型的语音识别方法
- DOI:--
- 发表时间:--
- 期刊:中南大学学报(自然科学版)
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
基于相似度的词聚类算法和可变长语言模型
- DOI:--
- 发表时间:--
- 期刊:小型微型计算机系统
- 影响因子:--
- 作者:袁里驰
- 通讯作者:袁里驰
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
袁里驰的其他基金
结合深度学习的句法语义联合分析模型研究
- 批准号:61962025
- 批准年份:2019
- 资助金额:39 万元
- 项目类别:地区科学基金项目
词汇化句法分析若干关键技术研究
- 批准号:61262035
- 批准年份:2012
- 资助金额:43.0 万元
- 项目类别:地区科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}