大規模分散並列処理に基づく統計的機械翻訳

基于大规模分布式并行处理的统计机器翻译

基本信息

  • 批准号:
    19024075
  • 负责人:
  • 金额:
    $ 6.02万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
  • 财政年份:
    2007
  • 资助国家:
    日本
  • 起止时间:
    2007 至 2008
  • 项目状态:
    已结题

项目摘要

本年度は、(1)階層的な句に基づく翻訳手法の高度化(須藤,渡辺,塚田)、および(2)半教師あり学習に基づく言語情報解析法の研究(鈴木,藤野,磯崎)の二つの課題に取り組んだ。研究課題(1)として,本年度はNTTの研究費によって開発した高次元素性を活用した翻訳手法を,評価型ワークショップIWSLT2008のタスクで評価した.昨年度も高次元素性を活用するアプローチでIWSLT2007に参加したが,今年は文脈情報を含むより高度な素性の活用を検討した.昨年度は翻訳デコーダと密に結合した学習器によって,高次元素性を扱ったが今年より柔軟な素性の扱いを優先し,翻訳結果を再順序付けする学習器で高次元素性を扱うアプローチをとった.最終的に、中英チャレンジタスクにおいて,我々は他チームの1/10〜1/100の量の学習データ(対訳コーパス)で、11チーム中,3位相当の成績を達成することができた.研究課題(2)としては,昨年度考案した「半教師あり学習法」による固有表現抽出器などのスケーラビリティの確認をさらなる大規模学習データで確認した.昨年度は10億語を超える学習データを利用した実験を行い,その成果は今年度ACL-2008に採録されたが,今年度はデータをさらに増やして40億語近いデータでも実験を行った.その結果,性能がさらに向上することを確認した.この他,NTTの研究費で考案した半教師あり学習に基づく文書分類法を、公開データ(報道記事,NTCIRタスク)で評価し,有効性を確認した.
This year, (1) this year Research topic (1) in this year's NTT research program, high-dimensional high-dimensional data processing techniques have been used in this year's NTT research program, which has been widely used in IWSLT2008 research. Last year, the high-dimensional sex was used flexibly. Yesterday, the IWSLT2007 participated in the competition. This year, there is a high degree of interest in the literature. Last year, in combination with the high-order metacomphasic devices, the results of the flip-flop results show that the higher-order metacomorphic devices are better than the previous ones. In the most popular, Chinese and English languages, I asked him to tell me that there are three students in the 11-year-old, one-hundred-thousand-one-ten-one-one, one-hundred-one, one-hundred percent, one-hundred percent, one hundred percent and one hundred percent. Research topic (2) in the last year's examination, the semi-pedagogical learning method was completed, and the inherent extractor was used to ensure that there was a significant improvement in large-scale modeling. Last year, there was a total of 1 billion yuan per year. Last year, we made use of the results of this year's ACL-2008 program. This year, we will spend nearly 4 billion dollars on the economy. The results show that the performance performance is up and down. He, NTT, research, examination plans, semi-teaching, basic learning, text classification, public reporting, NTCIR records, and sexual confirmation.

项目成果

期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
経験的リスク最小化に基づいた統計的機械翻訳システムの最適化
基于经验风险最小化的统计机器翻译系统优化
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    林克彦,渡辺太郎,塚田元,磯崎秀樹
  • 通讯作者:
    林克彦,渡辺太郎,塚田元,磯崎秀樹
NTT SMT System 2008 at NTCIR-7
NTT SMT 系统 2008 年 NTCIR-7
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Taro Watanabe;et al.
  • 通讯作者:
    et al.
Multi-label Classification using Logistic Regression Models for NTCIR-7 Patent Mining Task
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Akinori Fujino;Hideki Isozaki
  • 通讯作者:
    Akinori Fujino;Hideki Isozaki
NTT Statistical Machine Translation System for IWSLT 2008
IWSLT 2008 的 NTT 统计机器翻译系统
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Katsuhito Sudoh;et al.
  • 通讯作者:
    et al.
Semi-Supervised Sequential Labeling and Segmentation Using Giga-Word Scale Unlabeled Data
  • DOI:
  • 发表时间:
    2008-06
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jun Suzuki;Hideki Isozaki
  • 通讯作者:
    Jun Suzuki;Hideki Isozaki
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

塚田 元其他文献

塚田 元的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

コンテクストの異なる話者間の相互理解を促進する意図補完機構を備えた統計的機械翻訳
具有意图完成机制的统计机器翻译,可促进不同上下文的说话者之间的相互理解
  • 批准号:
    17J06394
  • 财政年份:
    2017
  • 资助金额:
    $ 6.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
構文構造の異なる言語間での統計的機械翻訳方式に関する研究
不同句法结构语言之间的统计机器翻译方法研究
  • 批准号:
    11J09312
  • 财政年份:
    2011
  • 资助金额:
    $ 6.02万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了