Formale Modelle und Algorithmen zur syntaxbasierten maschinellen Übersetzung natürlicher Sprachen

基于语法的自然语言机器翻译的形式模型和算法

基本信息

项目摘要

Beim Maschinellen Übersetzen von Text einer natürlichen Sprache in eine andere muss man insbesondere mit der inhärenten Mehrdeutigkeit von Sprache umgehen. Im Bereich der statistical machine translation (kurz: SMT) werden hierzu Wahrscheinlichkeiten verwandt. Drei wichtige Kernaufgaben der SMT sind (1) das Formalisieren des statistischen Übersetzungsmodell, (2) das Trainieren der Wahrscheinlichkeiten des Übersetzungsmodells und (3) die Konstruktion effizienter Algorithmen zur Berechnung von Übersetzungen (Decoding). Im Rahmen dieses Projekts wollen wir uns auf solche Übersetzungsmodelle beschränken, die als syntaxbasiert bezeichnet werden; sie beziehen die Syntax von Text in ihre Algorithmik mit ein und können dadurch zum Teil bessere Übersetzungen als die phrasenbasierten Ansätze liefern. Unter den Formalismen, die für die syntaxbasierte SMT verwendet werden, wollen wir synchronous tree-adjoining grammars (kurz: STAG) betrachten und durch formalsprachliche/automatentheoretische Untersuchungen die Güte dieses Formalismus für die SMT bewerten. Dann wollen wir versuchen, aus dem Trainieren und Dekodieren einen gemeinsamen algorithmischen Kern herauszuschälen, den man als Parsing bezeichnen kann, und diesen anschließend auf die Problemfelder des Trainierens und Dekodierens anwenden. Überlegungen zur Bestimmung der quantitativen Abweichung der Übersetzung vom Zielsprachmodell sollen unsere Untersuchungen abrunden. Eine Implementierung der Algorithmen ist in jedem Fall erforderlich, weil publizierte Vergleiche verschiedener Ansätze fast immer auf Laufzeiten von Systemen beruhen.
Beim Maschinellen Übersetzen von Text einer natürlichen Sprache in eine and ere muss man insbesondere mit der inhärenten Mehrdeutigkeit von Sprache umgehen.统计机器翻译(英语:statistical machine translation,缩写:SMT)是一种韦尔登。SMT的主要核心内容包括:(1)统计模型的形式化;(2)统计模型的训练;(3)有效的解码结构。In Rahmen dieses Projekts wollen wir uns auf solche Übersetzungmodelle beschränken,die als syntaxbasiert bezeichnet韦尔登; sie beziehen die extracting von Text in ihre jourmik mit ein and können dadaptizum Teil bessere Übersetzungen als die phrasenbasierten Ansätze liefern.在形式主义中,为了实现基于语法的SMT韦尔登,我们将使用同步树邻接文法(STAG),并通过形式语言/自动理论来研究SMT语法的形式化。然后,我们将通过一个通用的克恩算法来验证,人们可以进行语法分析,并在培训人员和Dekodierens的问题中进行分析。由Zielsprachmodell确定的Ubersetzung的定量Abweichung的Uberlegungen zur Bestimmung der quantitativen Abweichung sollen unsere Untersuchungen abunden。Eine Implementierung der Eschemen ist in jedem Fall erforderlich,weil schizierte Vergleiche verschedener Ansätze fast immer auf Laufzeiten von Systemen beruhen.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tree parsing for tree-adjoining machine translation
  • DOI:
    10.1093/logcom/exs050
  • 发表时间:
    2014-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Matthias Büchse;H. Vogler;M. Nederhof
  • 通讯作者:
    Matthias Büchse;H. Vogler;M. Nederhof
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr.-Ing. Heiko Vogler其他文献

Professor Dr.-Ing. Heiko Vogler的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr.-Ing. Heiko Vogler', 18)}}的其他基金

Hybrid grammars for discontinuous phrase structure trees
不连续短语结构树的混合语法
  • 批准号:
    255344147
  • 财政年份:
    2014
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Gewichtete Baumübersetzer als formales Werkzeug für die Syntax-basierte maschinelle Übersetzung natürlicher Sprachen
加权树翻译器作为自然语言基于语法的机器翻译的正式工具
  • 批准号:
    142808156
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Gewichtete Baumautomaten über Multioperator-Monoiden
多算子幺半群上的加权树自动机
  • 批准号:
    28443503
  • 财政年份:
    2006
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似海外基金

Die Funktionsweise der nicht-invasiven Gehirnstimulation beim Menschen verstehen: Entwicklung und Anwendung realistischer biophysikalischer Modelle
了解非侵入性脑刺激如何在人体中发挥作用:现实生物物理模型的开发和应用
  • 批准号:
    208316166
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Losgrößenplanung mit integrierter Koordination von Rüstressourcen - Modelle und Lösungsverfahren
批量大小规划与设置资源的集成协调 - 模型和解决方案程序
  • 批准号:
    220835757
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Räumlich explizite Modelle und Szenarien funktionaler Vegetationsmuster
功能植被格局的空间明确模型和场景
  • 批准号:
    172401688
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Stochastische Modelle zur Beschreibung von Zellteilungsprozessen und Bruchstrukturen
描述细胞分裂过程和断裂结构的随机模型
  • 批准号:
    192098834
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Dynamisches Verhalten von Resonanzzuständen für singulär gestörte Modelle der Schrödingertheorie und Modelle der Feldtheorie
薛定谔理论和场论模型的奇异扰动模型的共振态动态行为
  • 批准号:
    172250559
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Fellowships
Modelle für eine verbesserte Transparenz zu Werturteilen und Ethik in einer Evidenzbasierten Medizin
提高循证医学价值判断和伦理透明度的模型
  • 批准号:
    173159405
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Entwicklung numerischer Modelle zur Vorhersage kavitationsbedingter Geräusche und Erosion in Hydraulikventilen mittels LES
使用 LES 开发数值模型来预测液压阀中与气蚀相关的噪声和腐蚀
  • 批准号:
    175375325
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Untersuchung und Identifikation kritischer Faktoren für die Objekterkennung und das Training erscheinungsbasierter, kompositioneller Modelle
调查和识别物体识别的关键因素以及基于外观的组合模型的训练
  • 批准号:
    179792144
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Materielle Modelle in Forschung und Lehre: Erfassung, Dokumentation und Untersuchung von Modellen in universitären Sammlungen
研究和教学中的材料模型:记录、记录和检查大学收藏中的模型
  • 批准号:
    161046729
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Niedrigdimensionale Modelle für Raumluftströmungen in einfachen und komplexen Geometrien
简单和复杂几何形状的室内空气流动的低维模型
  • 批准号:
    175005396
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了