Natural Language Understanding Based on Discourse Structure and Knowledge
基于语篇结构和知识的自然语言理解
基本信息
- 批准号:18J12366
- 负责人:
- 金额:$ 0.96万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for JSPS Fellows
- 财政年份:2018
- 资助国家:日本
- 起止时间:2018-04-25 至 2020-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
2019年度は、昨年度に引き続き教師なし談話構造解析という問題に取り組んだ。教師なし談話構造解析とは、与えられた文章の構造を人手による教師情報なしに、文書集合から解析する技術である。本年度でも、修辞構造理論に基づき、一つの文書に対し一つの木構造を仮定した。本年度では特に、談話構造を構成する要素のうち構成素構造と核性構造の推定に焦点を当てて研究を行った。まず、談話構成素構造の教師なし解析については、昨年度までの提案手法をさらに拡張した。RST-DTと英文ニュース記事を用いた実験によって、提案手法が既存の教師あり手法と同等、もしくはそれ以上の解析精度に到達することを示した。また、提案した初期化手法によって解析精度が9.1ポイント向上することがわかった。以上の結果は、英語論文として自然言語処理のトップ国際論文誌に採択された。本年度の後半では教師なし談話核性分類という問題に取り組んだ。談話の核性とは、テキストスパン間の主従関係を表す情報であり、構成素構造および談話関係と補完的な関係にある。談話核性分類とは、より形式的には、結合する2つのテキストスパンのペアが与えられたときに、それらのうちどちらがもう一方の主要部であるかを同定するタスクであり、本研究ではそれを教師情報なしで行う。Carlsonら (2001) の削除テストという考え方に基づき、本研究ではそれを自動的に行う教師なし手法を提案した。すなわち、二つの談話関係によって結合するテキストスパンのうち、削除することによって文書の首尾一貫性がより損なわれてしまう方は、そうでない方に対する核と考える。RST-DTを用いた実験によって、提案手法がベースラインの教師なし分類器よりも高い正解率を達成することがわかった。以上の結果は、言語処理学会第26回年次大会で若手奨励賞を受賞し、それを拡張したものを現在、英語論文として投稿準備中である。
In 2019, the teacher's speech structure analysis and the problem selection group were selected. Teacher talk structure analysis, and article structure, teacher information, document set analysis, This year, the theory of rhetorical structure is based on a series of documents. This year, we will focus on the study of structural elements and nuclear structures. In addition, the teacher's analysis of the composition of the conversation and the proposal method of the previous year were also discussed. RST-DT is used to record information, propose methods, and present information. The resolution accuracy is 9.1%. The above results are collected from the International Journal of Natural Speech Processing. In the second half of the year, teachers talked about nuclear classification and problem selection. The relationship between the core and the core of the conversation is expressed in terms of information, composition and conversation. The core of the conversation is classified into two parts: one is the main part of the conversation, the other is the main part of the conversation, and the other is the main part of the conversation. Carlson (2001) proposed a method for eliminating the problem of "teacher's behavior." The relationship between the two sides of the text is discussed in detail. RST-DT is used to improve the accuracy of the classification. The results of the 26th Annual Conference of the Speech Processing Society are presented in English.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Unsupervised Discourse Constituency Parsing Using Viterbi EM
- DOI:10.1162/tacl_a_00312
- 发表时间:2020-04
- 期刊:
- 影响因子:10.9
- 作者:Noriki Nishida;Hideki Nakayama
- 通讯作者:Noriki Nishida;Hideki Nakayama
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
西田 典起其他文献
西田 典起的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('西田 典起', 18)}}的其他基金
新たな医療知識の獲得に向けた医学系論文の文脈構造の解析と情報抽出への応用
医学论文上下文结构分析及其在信息提取中获取新医学知识的应用
- 批准号:
21K17815 - 财政年份:2021
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
相似海外基金
動画談話構造解析とそれを用いた要約生成
视频话语结构分析和摘要生成
- 批准号:
21H03505 - 财政年份:2021
- 资助金额:
$ 0.96万 - 项目类别:
Grant-in-Aid for Scientific Research (B)