基于大规模无标注语料的跨领域跨语言汉语依存句法分析
项目介绍
AI项目解读
基本信息
- 批准号:61572338
- 项目类别:面上项目
- 资助金额:63.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2019
- 批准年份:2015
- 项目状态:已结题
- 起止时间:2016-01-01 至2019-12-31
- 项目参与者:李正华; 钱忠; 孙静; 马春平; 郁俊杰; 陈志鹏; 龚慧敏;
- 关键词:
项目摘要
Dependency parsing is an important research topic in Natural Language Processing. The accuracies of Chinese dependency parsers are much lower than English dependency parsers. It becomes one of the bottlenecks of Chinese dependency parsing. To tackle with the problems of data sparseness and domain adaptation in Chinese dependency parsing, this project aims to utilize multi-domain and multi-lingual large unlabeled data to improve Chinese dependency parsing, especially on web data. The main content includes: 1) Build a framework of multi-level dependency relation representations based on large unlabeled data; 2) Perform cross-domain transfer learning for Chinese dependency parsing using multi-domain large unlabeled data; 3) Perform cross-lingual transfer learning for Chinese dependency parsing using multi-lingual large unlabeled data; 4) Propose a new Chinese dependency parsing model which can use multi-feature representations and design new decoding algorithms for the model. Based on the above techniques, we build a platform for Chinese dependency parsing. This project will make important contributions for Chinese dependency parsing and provide reliable parse trees for further applications.
依存句法分析是自然语言处理的一个核心问题。与英语依存分析相比,汉语依存分析在性能上还存在较大差距,成为制约中文信息处理的一个瓶颈。本项目针对汉语依存分析中存在的人工标注训练语料不足和领域自适应能力差等关键问题,重点探索如何利用大规模多领域跨语言无标注语料来改进汉语依存分析性能,特别是在处理互联网文本时的依存分析性能,大力提高汉语依存分析的研究水平。为此,本项目拟从四个方面开展创新性研究:1)研究基于大规模无标注语料的依存特征表示体系;2)研究基于大规模多领域语料的面向互联网文本分析的跨领域迁移学习;3)研究基于大规模跨语言语料的面向汉语依存分析的跨语言迁移学习;4)研究基于多信息源的汉语依存句法分析模型和解码算法。最后,集成上述研究成果,构建一个领域自适应能力强的高性能汉语依存分析平台。本项目的开展将为汉语依存句法分析研究作出重要贡献,并为后续应用研究提供有力支持。
结项摘要
依存结构句法分析是对句子进行结构分析,以得到句子中词与词之间依赖关系的处理过程。它是自然语言处理的一个核心问题。与英文依存分析相比,汉语依存分析的性能还存在较大差距,成为制约中文信息处理的一个瓶颈。本项目针对汉语依存分析中存在的人工标注训练语料不足和领域自适应能力差等关键问题,重点探索如何利用大规模多领域跨语言无标注语料改进汉语依存分析性能,大力提高汉语依存分析的研究水平。项目开展四年来,课题组主要在如下方面进行探索研究:1)研究基于大规模无标注语料的依存特征表示体系;2)研究基于大规模无标注语料的跨领域跨语言迁移学习;3)研究基于多信息源的汉语依存句法分析模型和解码算法;4)研究如何与后续应用之间的交互。主要成果如下:1)发表17篇论文,其中领域内顶级会议论文5篇、顶级期刊论文3篇;2)申请专利5项,软件著作权2项;3)培养7名硕士生和2名博士生;4)实现一个汉语语言分析平台。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(5)
Improving Shift-Reduce Phrase-Structure Parsing with Constituent Boundary Information
利用构成边界信息改进 Shift-Reduce 短语结构解析
- DOI:10.1111/coin.12094
- 发表时间:2017
- 期刊:Computational Intelligence
- 影响因子:2.8
- 作者:Chen Wenliang;Zhu Muhua;Zhang Min;Zhang Yue;Zhu Jingbo
- 通讯作者:Zhu Jingbo
基于BiLSTM-CRF的关键词自动抽取
- DOI:--
- 发表时间:2018
- 期刊:计算机科学
- 影响因子:--
- 作者:陈伟;吴友政;陈文亮;张民
- 通讯作者:张民
面向人机对话意图分类的混合神经网络模型
- DOI:--
- 发表时间:2019
- 期刊:软件学报
- 影响因子:--
- 作者:周俊佐;陈文亮;朱宗奎;何正球;张民
- 通讯作者:张民
Coupled POS Tagging on Heterogeneous Annotations
异构注释上的耦合词性标记
- DOI:10.1109/taslp.2016.2644262
- 发表时间:2017
- 期刊:IEEE-ACM Transactions on Audio Speech and Language Processing
- 影响因子:5.4
- 作者:Li Zhenghua;Chao Jiayuan;Zhang Min;Chen Wenliang;Zhang Meishan;Fu Guohong
- 通讯作者:Fu Guohong
大规模中文实体情感知识的自动获取
- DOI:--
- 发表时间:2018
- 期刊:中文信息学报
- 影响因子:--
- 作者:卢奇;陈文亮
- 通讯作者:陈文亮
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
高光谱在体组织成像方法的研究进展
- DOI:10.3788/lop57.080002
- 发表时间:2020
- 期刊:激光与光电子学进展
- 影响因子:--
- 作者:马雪洁;刘蓉;李晨曦;陈文亮;徐可欣
- 通讯作者:徐可欣
近红外光谱主成分分析与模糊聚类的典型地面目标物识别
- DOI:--
- 发表时间:2017
- 期刊:光谱学与光谱分析
- 影响因子:--
- 作者:李晨曦;孙哲;蒋景英;刘蓉;陈文亮;徐可欣
- 通讯作者:徐可欣
面向文本分类的文本特征学习
- DOI:--
- 发表时间:--
- 期刊:小型微型计算机系统. Vol.27, pp.360-362. 2006.
- 影响因子:--
- 作者:王安慧*;陈文亮;朱靖波
- 通讯作者:朱靖波
环形刀等残留高度多轴加工步距计算
- DOI:--
- 发表时间:--
- 期刊:南京航空航天大学学报
- 影响因子:--
- 作者:郝小忠;Ahmed A A Duroobi;陈文亮;何磊
- 通讯作者:何磊
航空薄壁件制孔毛刺生长控制工艺研究
- DOI:--
- 发表时间:2012
- 期刊:中国机械工程
- 影响因子:--
- 作者:洪华舟;韦红余;陈文亮;金霞;蒋红宇;王宇波;余路
- 通讯作者:余路
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
陈文亮的其他基金
低资源环境下的篇章级事件抽取研究
- 批准号:62376177
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
基于噪音数据的中文知识图谱增量式构建研究
- 批准号:61876115
- 批准年份:2018
- 资助金额:62.0 万元
- 项目类别:面上项目
汉英双语依存句法分析模型和算法研究
- 批准号:61203314
- 批准年份:2012
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}