コンテクストの異なる話者間の相互理解を促進する意図補完機構を備えた統計的機械翻訳

具有意图完成机制的统计机器翻译,可促进不同上下文的说话者之间的相互理解

基本信息

  • 批准号:
    17J06394
  • 负责人:
  • 金额:
    $ 1.34万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2017
  • 资助国家:
    日本
  • 起止时间:
    2017-04-26 至 2019-03-31
  • 项目状态:
    已结题

项目摘要

本研究「コンテクストの異なる話者間の相互理解を促進する意図補完機構を備えた統計的機械翻訳」は,より円滑な多言語間コミュニケーションや情報収集を目的とし,話者が持つ暗黙の意図を自動補完する日英,日中間の機械翻訳の実現を目指すものである.採用1年目には,未知の単語からの定義文生成を目的とし,入力単語の関連語の定義文を原型とし,それを編集することで定義文生成を行う新しい定義文生成モデルを提案した.採用2年目では,まず当該技術を機械翻訳へ導入することを目指し,より詳細な評価・分析を行った.その結果,(1)前年度までに利用していた訓練・評価用データセットは辞書資源(WordNet/GCIDE)から作られており,実際の対話において問題となりやすいエンティティ(例:人名,地名,楽曲や映画のタイトル)の定義文生成に用いることができないこと,(2)文化的・社会的コンテクストの差異によって理解が難しくなる表現は単一の「単語」だけでなく,複数の単語から構成される「句」も多く存在すること,(3)文脈ごとに適切な定義文は異なること,が判明した.本研究が目的とする「話者の意図を補完する機械翻訳」を実現するためには,上記の3問題を解決することが必要不可欠となる.そこで,採用2年目には意図補完機構の翻訳システムへの導入に先駆け,前述した3つの課題の対処に取り組んだ.まず,エンティティの定義文を生成することを可能とするため,Wikipediaを活用し世界最大規模の学習用・評価用データセットを新たに構築した.次に,採用1年目に設計した定義文生成モデルの拡張に取り組んだ.新たに提案したモデルは「単語」だけでなく「句」の定義文生成も可能であり,さらに文脈ごとに異なる定義文を生成可能である.最後に,上記のデータセットおよび提案手法を論文としてまとめ,トップ国際会議であるNAACL2019に採択された.
This study aims at facilitating mutual understanding between different speakers and providing statistical mechanical translation for the purpose of information collection. 1 year old, unknown language, definition text generation, purpose, input language, definition text prototype, compilation, definition text generation, new definition text generation, proposal. 2 years ago, when the technology was introduced mechanically, it was analyzed in detail. Results: (1) The previous year's use of dictionary resources for training and evaluation (WordNet/GCIDE)(For example: name, place name, song, picture, etc.) Definition of text generation,(2) Cultural and social differences, difficult to understand, performance of a single "single language", plural single language, composition of a sentence, existence of multiple,(3) Context appropriate definition of text. The purpose of this study is to solve the three problems mentioned above. In this regard, the introduction of a 2-year plan to complete the organization's transformation system is the first step in the process, and the above-mentioned 3 topics are selected from the group. The world's largest library. Second, the design of the first year to define the text generation, the selection of groups. New proposal Finally, the paper on NAACL2019 was published.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
系列編集モデルに基づく単語ベクトルからの定義文生成
基于系列编辑模型的词向量定义句生成
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kouga Kobayashi;Yuri Nozaki;Takayasu Fushimi;Tetsuji Satoh;石渡祥之佑,林佑明,Graham Neubig,吉永直樹,豊田正史,喜連川優
  • 通讯作者:
    石渡祥之佑,林佑明,Graham Neubig,吉永直樹,豊田正史,喜連川優
Carnegie Mellon University(米国)
卡内基梅隆大学(美国)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Learning to Describe Unknown Phrases with Local and Global Contexts
  • DOI:
    10.18653/v1/n19-1350
  • 发表时间:
    2019-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Shonosuke Ishiwatari;Hiroaki Hayashi;Naoki Yoshinaga;Graham Neubig;Shoetsu Sato;Masashi Toyoda;M. Kitsuregawa
  • 通讯作者:
    Shonosuke Ishiwatari;Hiroaki Hayashi;Naoki Yoshinaga;Graham Neubig;Shoetsu Sato;Masashi Toyoda;M. Kitsuregawa
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

石渡 祥之佑其他文献

発話状況を意識したオンライン上の対話における応答選択
在线对话中的响应选择与对话情境的意识
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐藤 翔悦;石渡 祥之佑;吉永 直樹;豊田 正史;喜連川 優
  • 通讯作者:
    喜連川 優

石渡 祥之佑的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

ナラティブはどのようにして生じるのか?-自然言語処理技術を用いた検討-
叙事是如何出现的?
  • 批准号:
    24K16786
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
言語流暢性課題の定性的分析方法の構築:語彙特性と自然言語処理の応用
构建语言流畅性任务的定性分析方法:词汇特征和自然语言处理的应用
  • 批准号:
    24K10484
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自然言語処理に最適な語彙と分割の仕方を自動で獲得する人工知能の創出
创建自动获取自然语言处理最佳词汇和切分方法的人工智能
  • 批准号:
    24K20852
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
能動学習を用いた、放射線科所見文重要度推定用自然言語処理システムの開発
开发自然语言处理系统,使用主动学习来评估放射学结果的重要性
  • 批准号:
    24K18797
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理技術を用いた食物アレルゲン性予測システム構築
利用自然语言处理技术构建食物过敏性预测系统
  • 批准号:
    24K01707
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
自然言語処理を用いた重粒子線治療の適応判定のための自動チャットシステムの開発
开发自动聊天系统,利用自然语言处理确定重离子放射治疗的适用性
  • 批准号:
    24K18821
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理を活用した皮質脳波解析による長文読解の神経ネットワーク基盤の解明
通过自然语言处理的皮层脑电图分析阐明长句阅读的神经网络基础
  • 批准号:
    24K18686
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理技術を用いた教授学習支援システムの開発
利用自然语言处理技术开发教学支持系统
  • 批准号:
    24K16768
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
自然言語処理を利用した1910-30年代の日本文芸批評の研究
利用自然语言处理研究 1910 年代至 1930 年代的日本文学批评
  • 批准号:
    24K15991
  • 财政年份:
    2024
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
教師が客観的に授業を自己評価するための自然言語処理による新しい発話分析法の開発
使用自然语言处理开发一种新的语音分析方法,供教师客观地自我评估他们的课程
  • 批准号:
    23K12785
  • 财政年份:
    2023
  • 资助金额:
    $ 1.34万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了