言語理論と機械学習の融合による照応解析

语言理论与机器学习相结合的照应分析

基本信息

  • 批准号:
    06J50722
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2006
  • 资助国家:
    日本
  • 起止时间:
    2006 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では,機械翻訳や情報抽出のような自然言語処理の応用分野に必須な要素技術の一つである照応解析の間題を対象に,言語学の分野で考察されてきた手がかりを効果的に学習ベースの解析手法に導人するかについて調査を行った.特に今年度の取り組みでは,ゼロ代名詞とその先行詞が同一の文内に出現する文内ゼロ照応解析の間題に焦点を当て,解析の手がかりとして有効にはたらくと考えられる文の構造情報を学習ベースの手法に効果的に導入する手法を提案した.この手法では,まず文の構造をゼロ照応の解析に役立つ粒度に抽象化し,この抽象化された構造を解析の際の素性の一つとして利用する.このような構造情報から分類に寄与する情報を学習するアルゴリズムとしてはブースティングに基づく学習アルゴリズムを利用し,実際に今回の手法が既存手法と比較して,劇的に解析精度の向上に貢献することを示した.この結果を国際学会であるCOLING-ACL 2007で発表し,AFNLP Asian Best Paper Awardを受賞した.また,上述の間題を含めた述語項構造・共参照解析の間題を分析/評価/学習するには,それらの情報が付与されたタグ付与コーパスが必要となる.今年度はこの間題にも取り組み,具体的には日本語新聞記事を対象とした述語項構造・共参照タグ付与コーパスを作成した.この取り組みでは,厳密な規定のない照応・共参照の概念について既存のタグ付与コーパスを参考に,どのようにこれらの概念を扱うべきかを議論し,また実際にタグ付与を行う上で,各概念のどのような点が間題となるのかを経験的に明かにした.また,今回の作業の結果作成された大規模なタグ付与コーパスを一般に公開した(http://cl.naist.jp/nldata/corpus/).
This study aims to investigate the mechanical translation, information extraction, and natural speech processing techniques necessary for the analysis of speech problems. In particular, this year's selection of pronouns and antecedents from the same text appears in the context of the analysis of the topic focus, analysis of the hand has been the text of the structural information to learn the method of introduction of the effect of the proposal This technique is used to abstract the structure of the text from its original structure to its original structure. The structure of the information from the classification of the information from the study, the use of the existing methods, the analysis of the accuracy of the upward contribution. COLING-ACL 2007 was awarded the AFNLP Asian Best Paper Award. The above problems include the structure of predicate terms, the analysis/evaluation/learning of co-reference analysis problems, and the necessary information to be paid and paid. This year's issue is divided into two groups, the specific one is Japanese news, the other is Japanese news, and the other is Japanese news. The concept of "co-reference" refers to the existing concept of "assignment" and "reference". The concept of "assignment" refers to the concept of "assignment" and "operation". The concept of "assignment" refers to the concept of "assignment". The results of this work were made public on a large scale (http://cl.naist.jp/nldata/corpus/).

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
NAISTテキストコーパス : 述語項構造と共参照関係のアノテーション
NAIST文本语料库:谓词术语结构和共指关系的注释
日本語書き言葉を対象とした述語項構造と共参照関係のあのテーション : NAISTテキストコーパス開発の経験から
书面日语的谓词-论元结构和共指关系:来自开发 NAIST 文本语料库的经验
Exploiting Syntactic Patterns as Clues Zero-Anaphora Resolution
利用句法模式作为线索零回指解析
ゼロ照応解析のための統語的パタンの学習
学习零照应分析的句法模式
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

飯田 龍其他文献

文脈解析 -述語項構造・照応・談話構造の解析-
语境分析-谓语论证结构、照应、语篇结构分析-
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笹野 遼平;飯田 龍
  • 通讯作者:
    飯田 龍
Pascual Martinez-Gomezv
帕斯夸尔·马丁内斯-戈麦斯
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笹野 遼平;飯田 龍;鈴木雄太,日野英逸,小嗣真人,小野寛太;Tree transducer induction for Question-Answering over Large Knowledge Bases
  • 通讯作者:
    Tree transducer induction for Question-Answering over Large Knowledge Bases

飯田 龍的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
  • 批准号:
    02F02348
  • 财政年份:
    2002
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
日本語ゼロ代名詞の先行詞の自動同定アルゴリズムに関する基礎研究および機械翻訳等の文書処理への実装
日语零代词先行词自动识别算法基础研究及在机器翻译等文档处理中的实现
  • 批准号:
    02F00348
  • 财政年份:
    2002
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
日本語の代名詞およびゼロ代名詞の"被束縛変項"解釈と"怠慢の代名詞"解釈
日语代词和零代词解释为“束缚变量”和“忽略代词”
  • 批准号:
    03851086
  • 财政年份:
    1991
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了