A Study on Context-aware Latent Variable Models for Neural Machine Translation

神经机器翻译上下文感知潜变量模型的研究

基本信息

  • 批准号:
    21K12031
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

令和4年度は、潜在変数を用いたコンテキストアウェアな機械翻訳の学習を目的として、1) 潜在ディリクレ配分法 (LDA) を用いたトランスフォーマーの研究、2) EMアルゴリズムを用いたバイリンガルサブワード分割の研究、3) 潜在拡散モデルを用いたマルチモーダル機械翻訳の研究、4) 階層型BARTによる生成型要約の研究を行った。1)について、潜在変数トピックモデルの有効性を確認するために、LDAにより与えられるタグを対訳文の先頭に付与して機械翻訳を行う手法を提案した。日英対訳コーパスASPECを用いた実験の結果、提案手法により翻訳精度BLEUが38.8%から39.0%まで向上することを確認できた。2)について、現在ほとんどの機械翻訳システムではトークン分割のためにサブワード分割が用いられているが、従来のサブワード分割は単言語を対象としていた。本研究では、ユニグラム言語モデルを基にして、2言語間のサブワードアライメントを潜在変数とするバイリンガルサブワード分割を提案した。サブワードの対応関係を学習するためにEMアルゴリズムを用いた。ASPECを用いた実験の結果、日英翻訳のBLEU値が26.7%から27.3%まで向上することが確認できた。3)について、潜在拡散モデルを用いることで、マルチモーダル機械翻訳に不要な画像情報を除去する画像変換を行う手法を提案した。Multi30kを用いた実験の結果、BLEU値が41.06%から41.20%まで向上することが確認できた。4)について、階層型モデルの有効性を確認するため、コンテキストアウェアな階層型BARTによる生成型要約の研究を行った。文レベルの情報と単語レベルの情報を階層的に融合するモデルを考案し、自動要約に適用した。実験の結果、要約精度ROUGEが40.88%から40.98%まで向上することが確認できた。
In the fourth year of this year, the purpose of mechanical inversion learning is to: 1) study on the use of latent extraction method (LDA); 2) study on the use of EM extraction method; 3) study on mechanical inversion of latent extraction method. 4) Research on hierarchical BART and generative offer. 1) The number of potential users is determined by the number of users. The accuracy of BLEU is 38.8% and 39.0% respectively. 2) In the middle of the game, the game is now divided into two parts: the game is divided into three parts: the game is divided into four parts: This study proposes a number of potential changes in the distribution of speech resources between different speech resources. The relationship between the two sides is not easy to understand. ASPEC's results were confirmed by BLEU values of 26.7% and 27.3% respectively. 3) To remove the image information, remove the image information, and propose the method of changing the image. Multi30k is used to determine the BLEU value of 41.06% and 41.20% respectively. 4) Research on the generative offer of hierarchical BART Text and text information, text and text information. Results and offer accuracy ROUGE is 40.88% and 40.98% respectively.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
バイリンガルサブワード分割のためのEMアルゴリズム
双语子词分割的 EM 算法
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松井 大樹;二宮 崇;田村 晃裕
  • 通讯作者:
    田村 晃裕
潜在拡散モデルによる変換画像を用いるマルチモーダルニューラル機械翻訳
使用潜在扩散模型转换图像的多模态神经机器翻译
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    湯浅 亮也;田村 晃裕;梶原 智之;二宮 崇;加藤 恒夫
  • 通讯作者:
    加藤 恒夫
Hie-BART: Abstractive Summarization by Hierarchical BART
Hie-BART:分层 BART 的抽象概括
  • DOI:
    10.5715/jnlp.29.835
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    秋山 和輝;田村 晃裕;二宮 崇;梶原 智之
  • 通讯作者:
    梶原 智之
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

二宮 崇其他文献

CKYに基づく畳み込みアテンション構造を用いたニューラル機械翻訳
基于CKY的使用卷积注意力结构的神经机器翻译
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    渡邊 大貴;田村 晃裕;二宮 崇;Teguh Bharata Adji
  • 通讯作者:
    Teguh Bharata Adji
EGFR変異陽性NSCLCに対するafatinib・bevacizumab併用療法の第I相試験:OLCSG1404
阿法替尼和贝伐珠单抗联合治疗 EGFR 突变阳性 NSCLC 的 I 期研究:OLCSG1404
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    青江 啓介;近森 研一;前田 忠士;亀井 治人;二宮 崇;野上 尚之;別所 昭宏;久山 彰一;藤本 伸一;杉本 啓介;瀧川 奈義夫;木浦 勝行
  • 通讯作者:
    木浦 勝行
3年先を見据えたAI~機械学習と深層学習~
AI 展望未来 3 年 ~ 机器学习和深度学习 ~
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野口 敬輔;小川 達也;安保 良佑;高原 圭太;河野 靖;木下 浩二;二宮 崇;田村 晃裕;高橋 寛;王 森レイ;樋上 善信;藤田 欣裕;二宮 宏;二宮 崇
  • 通讯作者:
    二宮 崇
ニューラル機械翻訳のためのアテンション確率のスムージングとゲーティング学習
神经机器翻译的注意力概率平滑和门控学习
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    張 瀟廬;二宮 崇;田村 晃裕
  • 通讯作者:
    田村 晃裕
画像生成による疑似教師データを用いたマルチモーダルニューラル機械翻訳
使用图像生成生成的伪监督数据进行多模态神经机器翻译
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岩本 裕司;田村 晃裕;二宮 崇
  • 通讯作者:
    二宮 崇

二宮 崇的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('二宮 崇', 18)}}的其他基金

潜在拡散モデルを用いたニューラル機械翻訳の研究
基于潜在扩散模型的神经机器翻译研究
  • 批准号:
    24K15071
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
主辞駆動句構造文法に基づく並列処理を用いた頑健な自然言語処理の研究
基于头驱动短语结构语法的并行处理鲁棒自然语言处理研究
  • 批准号:
    98J04884
  • 财政年份:
    1998
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

深層ベイズ学習に基づく歌声の認識と生成の統一理論
基于深度贝叶斯学习的歌声识别与生成统一理论
  • 批准号:
    19J15255
  • 财政年份:
    2019
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了