Formale Modelle und Algorithmen zur syntaxbasierten maschinellen Übersetzung natürlicher Sprachen

基于语法的自然语言机器翻译的形式模型和算法

基本信息

项目摘要

Beim Maschinellen Übersetzen von Text einer natürlichen Sprache in eine andere muss man insbesondere mit der inhärenten Mehrdeutigkeit von Sprache umgehen. Im Bereich der statistical machine translation (kurz: SMT) werden hierzu Wahrscheinlichkeiten verwandt. Drei wichtige Kernaufgaben der SMT sind (1) das Formalisieren des statistischen Übersetzungsmodell, (2) das Trainieren der Wahrscheinlichkeiten des Übersetzungsmodells und (3) die Konstruktion effizienter Algorithmen zur Berechnung von Übersetzungen (Decoding). Im Rahmen dieses Projekts wollen wir uns auf solche Übersetzungsmodelle beschränken, die als syntaxbasiert bezeichnet werden; sie beziehen die Syntax von Text in ihre Algorithmik mit ein und können dadurch zum Teil bessere Übersetzungen als die phrasenbasierten Ansätze liefern. Unter den Formalismen, die für die syntaxbasierte SMT verwendet werden, wollen wir synchronous tree-adjoining grammars (kurz: STAG) betrachten und durch formalsprachliche/automatentheoretische Untersuchungen die Güte dieses Formalismus für die SMT bewerten. Dann wollen wir versuchen, aus dem Trainieren und Dekodieren einen gemeinsamen algorithmischen Kern herauszuschälen, den man als Parsing bezeichnen kann, und diesen anschließend auf die Problemfelder des Trainierens und Dekodierens anwenden. Überlegungen zur Bestimmung der quantitativen Abweichung der Übersetzung vom Zielsprachmodell sollen unsere Untersuchungen abrunden. Eine Implementierung der Algorithmen ist in jedem Fall erforderlich, weil publizierte Vergleiche verschiedener Ansätze fast immer auf Laufzeiten von Systemen beruhen.
在这两种情况下,我都不知道该怎么做了。我是Bereich der统计机器翻译(Kurz:SMT)。DREI Wichtige Kernaufgaben der SMT sind(1)das Formalisieren des Statistischenäbersetzungsmodelell,(2)das Trainieren der Wahrscheinlichkeiten desäbersetzungsmodells and(3)die Konstrukuktion Effizienter算法wur Berechnung vonúbersetzungen(译码)。Im Rahman dieses Projekts wollen wirn uns auf solcheúbersetzungsModel le be chränken,die als语法basiert bezeichnet werden;Sie bezieen die语法von Text in ihre算法MIT Ein and können dadurch zum teil bessereúbersetzungen als die短语enbasierten ansätze liefern。在形式化的基础上,建立了同步的树邻接文法(Kurz:STAG),并建立了形式化的树邻接文法/自动机理论。在此基础上,提出了一种新的训练方法和算法,并分析了训练过程中出现的问题。从数量上看,这是一种新的发展趋势。一种算法的实现是在Jedem Fall erforderlich,Weil Publizierte Vergleiche verschiedener Andätze fast immer auf Lauf Laufzeiten von Systeman beruhen.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Tree parsing for tree-adjoining machine translation
  • DOI:
    10.1093/logcom/exs050
  • 发表时间:
    2014-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Matthias Büchse;H. Vogler;M. Nederhof
  • 通讯作者:
    Matthias Büchse;H. Vogler;M. Nederhof
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr.-Ing. Heiko Vogler其他文献

Professor Dr.-Ing. Heiko Vogler的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr.-Ing. Heiko Vogler', 18)}}的其他基金

Hybrid grammars for discontinuous phrase structure trees
不连续短语结构树的混合语法
  • 批准号:
    255344147
  • 财政年份:
    2014
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Gewichtete Baumübersetzer als formales Werkzeug für die Syntax-basierte maschinelle Übersetzung natürlicher Sprachen
加权树翻译器作为自然语言基于语法的机器翻译的正式工具
  • 批准号:
    142808156
  • 财政年份:
    2009
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Gewichtete Baumautomaten über Multioperator-Monoiden
多算子幺半群上的加权树自动机
  • 批准号:
    28443503
  • 财政年份:
    2006
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似海外基金

Die Funktionsweise der nicht-invasiven Gehirnstimulation beim Menschen verstehen: Entwicklung und Anwendung realistischer biophysikalischer Modelle
了解非侵入性脑刺激如何在人体中发挥作用:现实生物物理模型的开发和应用
  • 批准号:
    208316166
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Losgrößenplanung mit integrierter Koordination von Rüstressourcen - Modelle und Lösungsverfahren
批量大小规划与设置资源的集成协调 - 模型和解决方案程序
  • 批准号:
    220835757
  • 财政年份:
    2012
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Räumlich explizite Modelle und Szenarien funktionaler Vegetationsmuster
功能植被格局的空间明确模型和场景
  • 批准号:
    172401688
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Stochastische Modelle zur Beschreibung von Zellteilungsprozessen und Bruchstrukturen
描述细胞分裂过程和断裂结构的随机模型
  • 批准号:
    192098834
  • 财政年份:
    2011
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Dynamisches Verhalten von Resonanzzuständen für singulär gestörte Modelle der Schrödingertheorie und Modelle der Feldtheorie
薛定谔理论和场论模型的奇异扰动模型的共振态动态行为
  • 批准号:
    172250559
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Fellowships
Modelle für eine verbesserte Transparenz zu Werturteilen und Ethik in einer Evidenzbasierten Medizin
提高循证医学价值判断和伦理透明度的模型
  • 批准号:
    173159405
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Entwicklung numerischer Modelle zur Vorhersage kavitationsbedingter Geräusche und Erosion in Hydraulikventilen mittels LES
使用 LES 开发数值模型来预测液压阀中与气蚀相关的噪声和腐蚀
  • 批准号:
    175375325
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Untersuchung und Identifikation kritischer Faktoren für die Objekterkennung und das Training erscheinungsbasierter, kompositioneller Modelle
调查和识别物体识别的关键因素以及基于外观的组合模型的训练
  • 批准号:
    179792144
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Materielle Modelle in Forschung und Lehre: Erfassung, Dokumentation und Untersuchung von Modellen in universitären Sammlungen
研究和教学中的材料模型:记录、记录和检查大学收藏中的模型
  • 批准号:
    161046729
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Niedrigdimensionale Modelle für Raumluftströmungen in einfachen und komplexen Geometrien
简单和复杂几何形状的室内空气流动的低维模型
  • 批准号:
    175005396
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了