大規模テキスト処理のためのスーパータグを用いた高精度かつ高速な深い構文解析

使用超级标签进行高精度、高速深度解析,进行大规模文本处理

基本信息

  • 批准号:
    11J09447
  • 负责人:
  • 金额:
    $ 0.83万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2012
  • 项目状态:
    已结题

项目摘要

2年目にあたる平成24年度の研究活動は順調に進展して来た。今年度は海外の研究者とも密な連携を行い、二つの方面で研究を進展させた。まず、分布意味論(distributional semantics)の分野において、句構造に対する高効率かつ高精度の意味予測手法を開発した。従来のPLS回帰では高次元の意味表現データについては大きな計算コストをかける必要があるのに対して、リッジ回帰と一般化交差検定を用いることで訓練過程を単純化し、精度を向上させつつ6倍程度の高速化に成功した。本手法は、3単語以上の長い句構造の意味予測タスクに対して、最先端の手法と比べて遜色ない成果を上げることが分かっている。更にこのような分布意味論を深い構文情報と組み合わせることで、文全体の意味を予測する手法も実装した。これらの研究成果は、国際会議(The 10th International Conference on Computational Semantics)において2報の論文にまとめ発表した。また論文誌(Natural Language Engineering)にも投稿を予定している。一方、半教師あり学習とグローバルな推論を組み合わせた手法について研究を行った。ローカルな学習とグローバルな推論を組み合わせた手法は、自然言語処理における複雑な問題に対して有効であることが分かっている。この手法を用いて、新聞記事における事象とその時間表現を対象とし、各事象の時間的な順序関係を推定した。ラベル付きデータの数は限られているため、意味役割付与の手法を用いてラベルなしデータに対しても事象および時間表現を抽出し、半教師あり学習とグローバルな推論を組み合わせることで、推定精度(F値)を44.71%から48.29%まで向上させることに成功した。今後、この手法をsupertaggingタスクに応用し、その成果を今年度の国際会議(EMNLP)に投稿する予定である。
The research activities in 2002 and 2004 have been progressing smoothly. This year, overseas researchers have made progress in their research. A method of high efficiency and high precision meaning prediction was developed for the differentiation and sentence structure of distributive semantics. The training process is highly purified, accurate, and 6 times faster than before. This method is used to predict the meaning of long-term sentence structure with more than 3 words, and the most advanced method is to compare the results with the results. Moreover, this theory of distributed meaning can deeply structure text information and combine it, and the method of predicting the meaning of the whole text can be implemented. The 10th International Conference on Computational Semantics was held in Beijing. Paper (Natural Language Engineering) A party, a teacher, a teacher For example, in the case of natural speech processing, the problem of complex speech processing is solved by combining the two methods. The method used in this article is to estimate the temporal relationship between the event and the event. The accuracy of the estimation is 44.71% and 48.29% respectively. The accuracy of the estimation is 44.71% and 48.29% respectively. In the future, the method of supertagging will be used, and the results will be submitted to this year's International Conference (EMNLP).

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Probabilistic Chinese word segmentation with non-local information and stochastic training
  • DOI:
    10.1016/j.ipm.2012.12.003
  • 发表时间:
    2013-05
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xu Sun;Yao-zhong Zhang;Takuya Matsuzaki;Yoshimasa Tsuruoka;Junichi Tsujii
  • 通讯作者:
    Xu Sun;Yao-zhong Zhang;Takuya Matsuzaki;Yoshimasa Tsuruoka;Junichi Tsujii
Method, program and system for finding correspondence between terms
查找术语对应关系的方法、程序和系统
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Structure-guided supertagger learning
结构引导的超级标记学习
  • DOI:
    10.1017/s1351324912000034
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    2.5
  • 作者:
    Yao-zhong Zhang;Takuya Matsuzaki;Jun'ichi Tsujii
  • 通讯作者:
    Jun'ichi Tsujii
Sentence paraphrase detection : When determiners and word order make the difference
句子释义检测:当限定词和词序产生差异时
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nghia Pham;Raffaella Bernardi;Yao-zhong Zhang;Marco Baroni
  • 通讯作者:
    Marco Baroni
Multi-Step Regression Learning for Compositional Distributional Semantics
  • DOI:
  • 发表时间:
    2013-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Edward Grefenstette;Georgiana Dinu;Yao-zhong Zhang;M. Sadrzadeh;Marco Baroni
  • 通讯作者:
    Edward Grefenstette;Georgiana Dinu;Yao-zhong Zhang;M. Sadrzadeh;Marco Baroni
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

張 耀中其他文献

張 耀中的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('張 耀中', 18)}}的其他基金

The development of a high-performance nanopore methylation detection method with consideration of structural variation
考虑结构变异的高性能纳米孔甲基化检测方法的开发
  • 批准号:
    21K12104
  • 财政年份:
    2021
  • 资助金额:
    $ 0.83万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了