基于大规模无标注语料的跨领域跨语言汉语依存句法分析

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61572338
  • 项目类别:
    面上项目
  • 资助金额:
    63.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0211.信息检索与社会计算
  • 结题年份:
    2019
  • 批准年份:
    2015
  • 项目状态:
    已结题
  • 起止时间:
    2016-01-01 至2019-12-31

项目摘要

Dependency parsing is an important research topic in Natural Language Processing. The accuracies of Chinese dependency parsers are much lower than English dependency parsers. It becomes one of the bottlenecks of Chinese dependency parsing. To tackle with the problems of data sparseness and domain adaptation in Chinese dependency parsing, this project aims to utilize multi-domain and multi-lingual large unlabeled data to improve Chinese dependency parsing, especially on web data. The main content includes: 1) Build a framework of multi-level dependency relation representations based on large unlabeled data; 2) Perform cross-domain transfer learning for Chinese dependency parsing using multi-domain large unlabeled data; 3) Perform cross-lingual transfer learning for Chinese dependency parsing using multi-lingual large unlabeled data; 4) Propose a new Chinese dependency parsing model which can use multi-feature representations and design new decoding algorithms for the model. Based on the above techniques, we build a platform for Chinese dependency parsing. This project will make important contributions for Chinese dependency parsing and provide reliable parse trees for further applications.
依存句法分析是自然语言处理的一个核心问题。与英语依存分析相比,汉语依存分析在性能上还存在较大差距,成为制约中文信息处理的一个瓶颈。本项目针对汉语依存分析中存在的人工标注训练语料不足和领域自适应能力差等关键问题,重点探索如何利用大规模多领域跨语言无标注语料来改进汉语依存分析性能,特别是在处理互联网文本时的依存分析性能,大力提高汉语依存分析的研究水平。为此,本项目拟从四个方面开展创新性研究:1)研究基于大规模无标注语料的依存特征表示体系;2)研究基于大规模多领域语料的面向互联网文本分析的跨领域迁移学习;3)研究基于大规模跨语言语料的面向汉语依存分析的跨语言迁移学习;4)研究基于多信息源的汉语依存句法分析模型和解码算法。最后,集成上述研究成果,构建一个领域自适应能力强的高性能汉语依存分析平台。本项目的开展将为汉语依存句法分析研究作出重要贡献,并为后续应用研究提供有力支持。

结项摘要

依存结构句法分析是对句子进行结构分析,以得到句子中词与词之间依赖关系的处理过程。它是自然语言处理的一个核心问题。与英文依存分析相比,汉语依存分析的性能还存在较大差距,成为制约中文信息处理的一个瓶颈。本项目针对汉语依存分析中存在的人工标注训练语料不足和领域自适应能力差等关键问题,重点探索如何利用大规模多领域跨语言无标注语料改进汉语依存分析性能,大力提高汉语依存分析的研究水平。项目开展四年来,课题组主要在如下方面进行探索研究:1)研究基于大规模无标注语料的依存特征表示体系;2)研究基于大规模无标注语料的跨领域跨语言迁移学习;3)研究基于多信息源的汉语依存句法分析模型和解码算法;4)研究如何与后续应用之间的交互。主要成果如下:1)发表17篇论文,其中领域内顶级会议论文5篇、顶级期刊论文3篇;2)申请专利5项,软件著作权2项;3)培养7名硕士生和2名博士生;4)实现一个汉语语言分析平台。

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(9)
专利数量(5)
Improving Shift-Reduce Phrase-Structure Parsing with Constituent Boundary Information
利用构成边界信息改进 Shift-Reduce 短语结构解析
  • DOI:
    10.1111/coin.12094
  • 发表时间:
    2017
  • 期刊:
    Computational Intelligence
  • 影响因子:
    2.8
  • 作者:
    Chen Wenliang;Zhu Muhua;Zhang Min;Zhang Yue;Zhu Jingbo
  • 通讯作者:
    Zhu Jingbo
基于BiLSTM-CRF的关键词自动抽取
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    计算机科学
  • 影响因子:
    --
  • 作者:
    陈伟;吴友政;陈文亮;张民
  • 通讯作者:
    张民
面向人机对话意图分类的混合神经网络模型
  • DOI:
    --
  • 发表时间:
    2019
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    周俊佐;陈文亮;朱宗奎;何正球;张民
  • 通讯作者:
    张民
Coupled POS Tagging on Heterogeneous Annotations
异构注释上的耦合词性标记
  • DOI:
    10.1109/taslp.2016.2644262
  • 发表时间:
    2017
  • 期刊:
    IEEE-ACM Transactions on Audio Speech and Language Processing
  • 影响因子:
    5.4
  • 作者:
    Li Zhenghua;Chao Jiayuan;Zhang Min;Chen Wenliang;Zhang Meishan;Fu Guohong
  • 通讯作者:
    Fu Guohong
大规模中文实体情感知识的自动获取
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    中文信息学报
  • 影响因子:
    --
  • 作者:
    卢奇;陈文亮
  • 通讯作者:
    陈文亮

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

高光谱在体组织成像方法的研究进展
  • DOI:
    10.3788/lop57.080002
  • 发表时间:
    2020
  • 期刊:
    激光与光电子学进展
  • 影响因子:
    --
  • 作者:
    马雪洁;刘蓉;李晨曦;陈文亮;徐可欣
  • 通讯作者:
    徐可欣
近红外光谱主成分分析与模糊聚类的典型地面目标物识别
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    光谱学与光谱分析
  • 影响因子:
    --
  • 作者:
    李晨曦;孙哲;蒋景英;刘蓉;陈文亮;徐可欣
  • 通讯作者:
    徐可欣
面向文本分类的文本特征学习
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    小型微型计算机系统. Vol.27, pp.360-362. 2006.
  • 影响因子:
    --
  • 作者:
    王安慧*;陈文亮;朱靖波
  • 通讯作者:
    朱靖波
环形刀等残留高度多轴加工步距计算
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    南京航空航天大学学报
  • 影响因子:
    --
  • 作者:
    郝小忠;Ahmed A A Duroobi;陈文亮;何磊
  • 通讯作者:
    何磊
航空薄壁件制孔毛刺生长控制工艺研究
  • DOI:
    --
  • 发表时间:
    2012
  • 期刊:
    中国机械工程
  • 影响因子:
    --
  • 作者:
    洪华舟;韦红余;陈文亮;金霞;蒋红宇;王宇波;余路
  • 通讯作者:
    余路

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

陈文亮的其他基金

低资源环境下的篇章级事件抽取研究
  • 批准号:
    62376177
  • 批准年份:
    2023
  • 资助金额:
    50 万元
  • 项目类别:
    面上项目
基于噪音数据的中文知识图谱增量式构建研究
  • 批准号:
    61876115
  • 批准年份:
    2018
  • 资助金额:
    62.0 万元
  • 项目类别:
    面上项目
汉英双语依存句法分析模型和算法研究
  • 批准号:
    61203314
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码