実世界の大規模言語資源からの翻訳知識獲得に基づく機械翻訳モデルの研究

基于现实世界大规模语言资源获取翻译知识的机器翻译模型研究

基本信息

  • 批准号:
    16700141
  • 负责人:
  • 金额:
    $ 2.37万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2004
  • 资助国家:
    日本
  • 起止时间:
    2004 至 2005
  • 项目状态:
    已结题

项目摘要

本研究では,現在の機械翻訳モデルの弱点を克服することを目的として,人間の翻訳者,特に,プロの翻訳者が持つ翻訳戦略を模倣し,計算機上の機械翻訳モデルとして実現することを目的として,以下の研究を行った.(i)翻訳対象の文書の原言語解析・翻訳変換・目的言語生成といった各処理を遂行するのに際して,あらかじめモデルが持っている言語知識が十分であるか否かを検出する機構を実現する.(ii)(i)で不足していると判定された言語知識を,実世界の大規模言語資源,具体的には,WWW上の文書群から収集するための戦略を,計算機上のソフトウェアとして実現する.本年度は,翻訳において必要な知識のうち,不足していると判定された言語知識を,WWW上の多言語文書群から獲得する技術について研究を行った.ここでは,従来より研究代表者が行ってきた翻訳知識獲得の要素技術を発展させる形で研究を行った.特に,これまでに開発した翻訳知識獲得技術は,WWW上の多言語報道記事を情報源として翻訳知識を獲得するというものであったが,本研究では,情報源を報道記事に限定せずに,WWW上の一般の多言語文書群に拡張して翻訳知識の獲得を行う.具体的には,いくつかの原言語用語およびその目的言語訳の組を「種」として,「種」の出現するページから多様な手がかりを収集し,翻訳知識獲得において有益な戦略を帰納的に発見するというアプローチをとった.ここでは,「種」となる原言語用語を用いて,翻訳対象の文書の専門分野を推定し,その専門分野の多言語文書を収集した結果から,専門分野特有の翻訳知識を獲得するという戦略であった.この汎用の戦略を,各々の専門分野に適応させて,各専門分野に特化した翻訳知識獲得の戦略を帰納的に発見するという技術の開発を行った.
This study で は, now の mechanical 訳 モ デ ル の weaknesses を す る こ と を purpose と し て, human の turn 訳, に, プ ロ の turn 訳 person が hold つ 訳 戦 slightly を imitate し, computer の mechanical turn 訳 モ デ ル と し て be presently す る こ と を purpose と し て, the following line の research を っ た. (I) turn 訳 like の seaborne documents の parsing the original words, double 訳 - change , objective speech production と い っ た each 処 Richard を carries out す る の に interstate し て, あ ら か じ め モ デ ル が hold っ て い knowledge が る words very で あ る か no か を 検 out す る institutions を be presently す る. (ii) (I) insufficient で し て い る と determine さ れ た を speech knowledge, be の world large-scale language resources, specific に は, WWW の documents on group of か ら 収 Set するため するため strategy を, <s:1> ソフトウェアと て て actual appearance する on the computer. は this year, double 訳 に お い て な necessary knowledge の う ち, insufficient し て い る と determine さ れ た を speech knowledge, の more words on the WWW document group か ら get す る technology に つ い を line っ て research た. こ こ で は, 従 to よ り research line represent が っ て き た turn 訳 knowledge acquisition technology の elements を 発 exhibition さ せ る line shape で research を っ た. に, こ れ ま で に open 発 し た turn 訳 は knowledge acquisition technology, on the WWW の chronicle reported speech を intelligence source と し て turn を 訳 knowledge is acquired す る と い う も の で あ っ た が, this study で は, intelligence source を chronicle reported に qualified せ ず に, に の の words more commonly on the WWW document group company, zhang し て turn の 訳 knowledge is acquired う を line. Specific に は, い く つ か の original words terms お よ び そ の purpose words 訳 の group を "kind of" と し て, "kind of" の appear す る ペ ー ジ か ら many others な hand が か り を し 収 set, double 訳 knowledge acquisition に お い て beneficial な 戦 slightly を 帰 of に 発 see す る と い う ア プ ロ ー チ を と っ た. こ こ で は, "kind of" と な る original words terms を with い て, turn 訳 like の documents seaborne の 専 door eset を presumptive し そ の 専 door eset の words more documents を 収 set し た results か ら, 専 を door eset の turn 訳 special knowledge is acquired す る と い う 戦 slightly で あ っ た. こ の domestic の 戦 slightly を, each 々 の 専 door eset に optimum 応 さ せ て, each 専 door eset に specialized し た turn 訳 knowledge acquisition の 戦 slightly を 帰 of に 発 see す る と い う technology To operate を lines った.

项目成果

期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Integrating Cross-Lingually Relevant News Articles and Monolingual Web Documents in Bilingual Lexicon Acquisition
在双语词典获取中整合跨语言相关新闻文章和单语网络文档
ウェブからの関連語収集手法を用いた専門用語の訳語推定
使用从网络收集相关词的方法来估计技术术语的翻译
Effect of domain-specific corpus in compositional translation estimation for technical terms
特定领域语料库在技术术语组合翻译估计中的作用
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masatsugu Tonoike;Mitsuhiro Kida;Toshihiro Takagi;Yasuhiro Sasaki;Takehito Utsuto and Satoshi Sato
  • 通讯作者:
    Takehito Utsuto and Satoshi Sato
ウェブを利用した専門用語の分野判定
使用网络现场确定技术术语
ウェブと要素合成法を用いた専門用語訳語推定
使用网络和元素合成方法的技术术语翻译估计
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

宇津呂 武仁其他文献

Wikipediaを知識源とする分野トピックモデルの推定と分析
以维基百科为知识源的领域主题模型估计与分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    牧田 健作;鈴木 浩子;小池 大地;宇津呂 武仁;河田 容英
  • 通讯作者:
    河田 容英
自然言語処理
自然语言处理
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    天野 真家;石崎 俊;宇津呂 武仁;成田 真澄;福本 淳一
  • 通讯作者:
    福本 淳一
乳幼児をもつ養育者の絵本購入行動と購入絵本に対する意識と行動―インターネット調査からの検討―
婴幼儿看护者绘本购买行为及其购买绘本认知和行为——网络调查研究——
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    笠松 美歩;上原 宏;宇津呂 武仁;齋藤 有;齋藤有
  • 通讯作者:
    齋藤有
時系列ニュース・ブログにおける話題同定に関する分析 --- 震災を例題として ---
时序新闻博客主题识别分析---以地震灾害为例---
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小池 大地;牧田 健作;宇津呂 武仁;吉岡 真治;河田 容英;福原 知宏
  • 通讯作者:
    福原 知宏
ウェブ検索者の情報要求観点の日中間対照分析
从网络搜索者信息请求的角度分析中日两国
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    鄭 立儀;小池 大地;聶 添;今田 貴和;陳 磊;宇津呂 武仁;河田 容英;神門 典子.
  • 通讯作者:
    神門 典子.

宇津呂 武仁的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('宇津呂 武仁', 18)}}的其他基金

WWW上の多言語文書から翻訳知識を発見するための知的インタフェースの研究
从WWW多语言文档中发现翻译知识的智能接口研究
  • 批准号:
    15017245
  • 财政年份:
    2003
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
言語横断情報検索および多言語情報抽出の技術を利用した翻訳知識獲得の研究
利用跨语言信息检索和多语言信息抽取技术获取翻译知识的研究
  • 批准号:
    14780275
  • 财政年份:
    2002
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
  • 批准号:
    12780282
  • 财政年份:
    2000
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模テキストデータに基づく名詞意味辞書の構築及び自然言語理解における利用
基于大规模文本数据的名词意义词典构建及其在自然语言理解中的应用
  • 批准号:
    11780275
  • 财政年份:
    1999
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
統計モデルに基づく大規模テキストへの言語情報付与及びテキストからの言語知識獲得
为大规模文本添加语言信息,基于统计模型从文本中获取语言知识
  • 批准号:
    09780338
  • 财政年份:
    1997
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
自然言語テキストからの語彙的知識獲得および獲得結果を利用した効率的文解析法
利用词汇知识获取和自然语言文本获取结果的高效句子分析方法
  • 批准号:
    07780326
  • 财政年份:
    1995
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

自然言語の構成性に着目した機械翻訳の研究
关注自然语言组合性的机器翻译研究
  • 批准号:
    23K21697
  • 财政年份:
    2024
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
機械翻訳と生成AIを活用したリーディング授業のモデル化に向けた教育効果の実証研究
使用机器翻译和生成人工智能建模阅读课程的教育效果的实证研究
  • 批准号:
    24K04148
  • 财政年份:
    2024
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
潜在拡散モデルを用いたニューラル機械翻訳の研究
基于潜在扩散模型的神经机器翻译研究
  • 批准号:
    24K15071
  • 财政年份:
    2024
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
海事英語知識ベース構築による海事英語機械翻訳の改善と翻訳エンジンの公開
构建海事英语知识库,发布翻译引擎,提升海事英语机器翻译水平
  • 批准号:
    24K03942
  • 财政年份:
    2024
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
機械翻訳を使用した英語リーディングの思考プロセスの解明
利用机器翻译阐明英语阅读的思维过程
  • 批准号:
    24K04171
  • 财政年份:
    2024
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
英語ライティング指導における機械翻訳の利用可能性ー脳機能イメージングの観点から
机器翻译在英语写作教学中的可能性:从功能性脑成像的角度
  • 批准号:
    24K04039
  • 财政年份:
    2024
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
機械翻訳時代の外国語教育を探求する
机器翻译时代的外语教育探索
  • 批准号:
    23K00780
  • 财政年份:
    2023
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
主辞駆動句構造文法に基づくニューラル機械翻訳の高度化
基于头部驱动短语结构语法的神经机器翻译的复杂性
  • 批准号:
    22KJ2286
  • 财政年份:
    2023
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
テキストレベルの手話-日本語ニューラル機械翻訳のための手話表現形式の検討
文本级手语的手语表达格式研究——日语神经机器翻译
  • 批准号:
    22K12147
  • 财政年份:
    2022
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
翻訳文の難易度を多段階で指定可能なニューラル機械翻訳
神经机器翻译,允许您指定多个级别的翻译句子的难度级别
  • 批准号:
    22K12177
  • 财政年份:
    2022
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了