基于半监督结构化学习的跨语言映射研究
项目介绍
AI项目解读
基本信息
- 批准号:61173073
- 项目类别:面上项目
- 资助金额:57.0万
- 负责人:
- 依托单位:
- 学科分类:F0211.信息检索与社会计算
- 结题年份:2015
- 批准年份:2011
- 项目状态:已结题
- 起止时间:2012-01-01 至2015-12-31
- 项目参与者:曹海龙; 于墨; 梁华参; 张春越; 胡鹏龙; 王澍; 秦彦霞; 韩威; 李婷婷;
- 关键词:
项目摘要
语料资源缺乏的小语种语言的自然语言处理技术受到语料资源的限制而难以发展高精度的统计方法。当前的跨语言映射方法局限于双语对齐句对的词对齐结果,双语间标注的映射方法难以处理复杂对应关系、准确率低。为此,本课题提出了通过统计方法从语料中学习映射模型,并允许映射模型与目标模型彼此互相改进的跨语言映射框架。为了完成这一任务,本课题将结构化数据的自然语言处理任务的跨语言映射形式化为半监督结构化学习问题,利用半监督结构化学习方法,结合自然语言处理问题的任务特性,为跨语言映射问题提供新的解决方案。同时,本课题希望将语言的更抽象的属性引入到跨语言映射的半监督学习框架中,而不仅限于词对齐结果。这些抽象属性既包括语言学符号及其关系,也包括通过双语上下文统计得出的相似关系。这些属性使得双语语料中的更多信息可以得到利用,帮助提高跨语言映射方法的精度。
结项摘要
在许多自然语言处理任务中,往往受到语料资源的限制而难以发展高精度的统计方法。为了减少对标注数据的依赖,本项目提出了关于自然语言处理的若干半监督学习方法,主要研究内容包括:(1)将跨语言映射问题转换为半监督结构化学习问题,并建立符合问题特点的模型;(2)对已有半监督方法在结构化数据上加以推广,通过在新的问题表示空间上利用少量有标记数据进行参数细调,同时将随机梯度下降思想引入到相关半监督学习框架中并对随机梯度下降方法进行了改进;(3)将资源充分语言的相关知识以多种关联形式迁移到新语言的知识学习中,改进了从可比较语料中抽取同义词对的性能。.在研究内容的第一方面,本项目分别进行了跨语言映射的半监督结构化学习框架和跨语言映射的噪声可学习性问题及去噪算法的研究。提出了基于协同训练的半监督跨语言映射算法和基于标签传播的半监督跨语言映射算法,实验表明协同训练算法在目标语言词性标注的性能上达到81.14%,比同类最好算法提高了近2个百分点;而标签传播算法在词性标注跨语言映射上性能从81.78%提升至83.28%。将二类分类问题的噪声学习理论推广到多类上,得到多类分类问题的噪声可学习性理论。证明了多类分类任务的噪声PAC可学习性和生成式一阶序列标注模型势函数的噪声PAC可学习性,在此基础上提出了基于置信度的协同训练数据选择和基于n元词组相似度的去噪方法。.在研究内容的第二方面,提出了一种基于丰富特征的结构表示合成模型(Feature-rich Compositional Embedding Model,FCM)。该模型在ACE2005关系抽取任务测试集上取得了比基线系统高4%的性能,达到58.26%。提出了基于目标任务和语言模型的联合训练算法框架,该方法在短语嵌入学习上的实验结果超过了有监督方法,取得了当时最好性能。.在研究内容的第三方面,本项目提出了结合时序分布表示和词嵌入表示的双语词典抽取方法、基于典型关联分析(Canonical Correlation Analysis,CCA)的强制关联方法,这两种方法在相关实验上均取得了远超基线系统的性能。还提出了基于局部加权线性回归方法的双语词典抽取的方法,其实验结果相比基线系统增长了36.7%。.本项目对于跨语言映射的半监督结构化学习框架及其应用通用的自然语言结构表示的研究具有很好参考价值
项目成果
期刊论文数量(27)
专著数量(0)
科研奖励数量(0)
会议论文数量(56)
专利数量(0)
层次短语翻译中基于 Markov 随机场的层次切分模型lowast;
- DOI:--
- 发表时间:2012
- 期刊:软件学报
- 影响因子:--
- 作者:赵铁军;曹海龙;朱聪慧;张春越
- 通讯作者:张春越
Decorated Phrase Model and Syntax-Based Reordering Model for Statistical Machine Translation
统计机器翻译的装饰短语模型和基于句法的重排序模型
- DOI:10.30000/ijfs.201206.0016
- 发表时间:2012-06
- 期刊:International Journal of Fuzzy Systems
- 影响因子:4.3
- 作者:Huashen Liang;Yongzeng Xue;Tiejun Zhao
- 通讯作者:Tiejun Zhao
基于条件随机域模型的比较要素抽取研究
- DOI:--
- 发表时间:2015
- 期刊:自动化学报
- 影响因子:--
- 作者:王巍;赵铁军;辛国栋;徐永东
- 通讯作者:徐永东
层次短语翻译中基于 Markov 随机场的层次切分模型
- DOI:--
- 发表时间:2012
- 期刊:软件学报
- 影响因子:--
- 作者:赵铁军;曹海龙;朱聪慧;张春越
- 通讯作者:张春越
Large Scale Semi-supervised Linear SVM with Stochastic Gradient Descent
具有随机梯度下降的大规模半监督线性支持向量机
- DOI:--
- 发表时间:2013
- 期刊:Journal of Computational Information Systems
- 影响因子:--
- 作者:Xin Zhou, Conghui Zhu, Sheng Li, Mo Yu
- 通讯作者:Xin Zhou, Conghui Zhu, Sheng Li, Mo Yu
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--"}}
- 发表时间:{{ item.publish_year || "--" }}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--"}}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.authors }}
数据更新时间:{{ patent.updateTime }}
其他文献
埋入式混凝土用Ag/AgCl工作电极制备与性能表征
- DOI:--
- 发表时间:2020
- 期刊:建筑材料学报
- 影响因子:--
- 作者:王鹏刚;郭腾飞;赵铁军;李振垒;万小梅
- 通讯作者:万小梅
基于内容分析的话题检测研究
- DOI:--
- 发表时间:--
- 期刊:哈尔滨工业大学学报, 核心期刊
- 影响因子:--
- 作者:赵华;赵铁军;张姝;王浩畅
- 通讯作者:王浩畅
Durability Monitoring of Concrete Structure of Subsea Tunnel
海底隧道混凝土结构耐久性监测
- DOI:--
- 发表时间:2013
- 期刊:硅酸盐学报
- 影响因子:--
- 作者:金祖权;赵铁军;张鹏;高嵩
- 通讯作者:高嵩
嵌入式钢筋腐蚀监测系统研究综述
- DOI:--
- 发表时间:--
- 期刊:工程建设
- 影响因子:--
- 作者:赵铁军;陈际洲;赵彦迪;孙朋朋;徐建光
- 通讯作者:徐建光
考虑需求响应的增量配电网分布式电源优化配置
- DOI:10.19635/j.cnki.csu-epsa.000370
- 发表时间:2020
- 期刊:电力系统及其自动化学报
- 影响因子:--
- 作者:张长久;贾清泉;赵铁军;谢小英;牛益国
- 通讯作者:牛益国
其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi || "--" }}
- 发表时间:{{ item.publish_year || "--"}}
- 期刊:{{ item.journal_name }}
- 影响因子:{{ item.factor || "--" }}
- 作者:{{ item.authors }}
- 通讯作者:{{ item.author }}

内容获取失败,请点击重试

查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:
AI项目摘要
AI项目思路
AI技术路线图

请为本次AI项目解读的内容对您的实用性打分
非常不实用
非常实用
1
2
3
4
5
6
7
8
9
10
您认为此功能如何分析更能满足您的需求,请填写您的反馈:
赵铁军的其他基金
知识驱动的文本生成模型研究
- 批准号:62376075
- 批准年份:2023
- 资助金额:51 万元
- 项目类别:面上项目
面向汉语文本理解的语义计算方法
- 批准号:91520204
- 批准年份:2015
- 资助金额:171.0 万元
- 项目类别:重大研究计划
英汉动词次范畴化对应关系自动获取研究
- 批准号:60773069
- 批准年份:2007
- 资助金额:28.0 万元
- 项目类别:面上项目
基于Ontology的自然语言描述的空间概念三维可视化研究
- 批准号:60575041
- 批准年份:2005
- 资助金额:23.0 万元
- 项目类别:面上项目
汉语动词次范畴化自动获取技术的研究
- 批准号:60373101
- 批准年份:2003
- 资助金额:23.0 万元
- 项目类别:面上项目
相似国自然基金
{{ item.name }}
- 批准号:{{ item.ratify_no }}
- 批准年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}
相似海外基金
{{
item.name }}
{{ item.translate_name }}
- 批准号:{{ item.ratify_no }}
- 财政年份:{{ item.approval_year }}
- 资助金额:{{ item.support_num }}
- 项目类别:{{ item.project_type }}