Domänen- und dokumentenadaptive Verfahren zur Nachkorrektur von OCR-Ergebnissen

用于 OCR 结果后校正的域和文档自适应程序

基本信息

项目摘要

Die Konvertierung von Papierdokumenten in ein textuelles elektronisches Format ist ein zentraler Schritt bei der Archivierung von Dokumenten in Firmen, Organisationen und im Verlagswesen. Trotz der hohen Leistungsfähigkeit kommerzieller OCR-Systeme ist die verbleibende Fehlerrate bei fehlerkritischen Anwendungen aber oft inakzeptabel. Bislang entwickelte Verfahren zur interaktiven oder automatischen Nachkorrektur von OCR-Ergebnissen tragen zu einer Verbesserung bei, lassen jedoch Domäne und spezifische Eigenschaften des einzelnen Dokuments bei der Auswahl von Korrekturvorschlägen weitgehend unberücksichtigt, worunter die Qualität der Nachkorrektur leidet. Im Projekt sollen Verfahren entwickelt werden, mit denen in dynamischer Weise domänen- und dokumentenspezifische Lexika, Sprach- und Korrekturmodelle berechnet werden können, die thematischen Inhalt, Domäne und sprachliche Eigenschaften des Ausgangsdokuments mitberücksichtigen. Um die Adaptivität und Leistungsfähigkeit von Verfahren der Nachkorrektur bei der Bearbeitung neuer Dokumente zu verbessern, sollen Methoden zur computerunterstützten Optimierung bei der Auswahl, Kombination und Parametereinstellung von Korrekturressourcen weiterentwickelt werden.
文件文件的归档与电子文本的归档与电子文本的归档与电子文本的归档与电子文件的归档。Trotz der hohen Leistungsfähigkeit kommerzieller ocr - system ist die verbleibende Fehlerrate bei fehlerkritischen Anwendungen aberofinakzeptabel。2 .建立一个基于交互的自动化系统,建立一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统,创建一个基于交互的自动化系统。[1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] [1]Um die Adaptivität und Leistungsfähigkeit von Verfahren der Nachkorrektur beder der Bearbeitung nederdokumente zuverbessern, sollen Methoden zur computerunterst<s:1> tztenoptimierung bederauswahl,组合与参数instellung von Korrekturressourcen weiterentwickelt werden。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr. Klaus U. Schulz其他文献

Professor Dr. Klaus U. Schulz的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr. Klaus U. Schulz', 18)}}的其他基金

Training of machine-learning based procedures for automated postcorrection of OCRed historical printings
基于机器学习的程序培训,用于 ORed 历史打印的自动后期校正
  • 批准号:
    431091758
  • 财政年份:
    2020
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Automated postcorrection of OCRed historical printings with integrated optional interactive postcorrection
通过集成的可选交互式后期校正对 ORed 历史打印进行自动后期校正
  • 批准号:
    393215159
  • 财政年份:
    2018
  • 资助金额:
    --
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
Development of a web-based system for the postcorrection of historical OCR'ed texts
开发基于网络的系统,用于对历史 OCR 文本进行后校正
  • 批准号:
    314731081
  • 财政年份:
    2016
  • 资助金额:
    --
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
Erweiterung eines Abfragemodells für XML-Daten zur interaktiven Exploration
扩展 XML 数据的查询模型以进行交互式探索
  • 批准号:
    5231068
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Research Grants

相似国自然基金

Nen-CO2和Arn-CO2复合物中红外激光光谱研究
  • 批准号:
    11304095
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Charakterisierung funktioneller Domänen in der NS2-3-Cysteinprotease und der NS3-4A-Serinprotease des Hepatitis C-Virus
丙型肝炎病毒NS2-3半胱氨酸蛋白酶和NS3-4A丝氨酸蛋白酶功能域的表征
  • 批准号:
    159853367
  • 财政年份:
    2010
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Wechselwirkungen zwischen Domänen der archaeellen Transkriptionsmaschinerie und Vergleich mit dem eukaryotischen System
古细菌转录机制域之间的相互作用以及与真核系统的比较
  • 批准号:
    75998638
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Research Units
Bedeutung funktioneller Domänen von Ataxin-3 beim Transport und Abbau fehlgefalteter Proteine
ataxin-3 功能域在错误折叠蛋白转运和降解中的重要性
  • 批准号:
    48410914
  • 财政年份:
    2007
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Charakterisierung relevanter Sorptionsdomänen in Grundwasserleitern für lösliche aromatische organische Schadstoffe am Beispiel eines sauren Phenols und eines basischen Anilins
以酸性苯酚和碱性苯胺为例,表征含水层中可溶性芳香族有机污染物的相关吸附域
  • 批准号:
    20681794
  • 财政年份:
    2005
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Modulation der Zwei-Porendomänen-Kaliumkanäle KCNKO und KCNK2 durch bioaktive Phospholipide, freie Fettsäuren und mechanische Dehnungsreize
生物活性磷脂、游离脂肪酸和机械拉伸刺激对双孔域钾通道 KCNKO 和 KCNK2 的调节
  • 批准号:
    5440941
  • 财政年份:
    2005
  • 资助金额:
    --
  • 项目类别:
    Emmy Noether International Fellowships
Dünen als Archive zur Rekonstruktion der quartären Klima- und Landschaftsgeschichte im Lake Eyre Becken und im Murray Becken in Südaustralien
沙丘作为重建南澳大利亚艾尔湖盆地和墨累盆地第四纪气候和景观历史的档案
  • 批准号:
    5439943
  • 财政年份:
    2005
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Adel im grünen Rock. Adliges Jägertum, Großprivatwaldbesitz und die preußische Forstbeamtenschaft 1866 - 1914
身穿绿衣的贵族气质。
  • 批准号:
    5425703
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Publication Grants
Pollenanalytische Untersuchungen an mittelpleistozänen, interglazialen Sedimenten aus Bilshausen, Niedersachsen, und ihre klimatische Auswertung
下萨克森州比尔豪森中更新世、间冰期沉积物的花粉分析研究及其气候评估
  • 批准号:
    5445968
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Bedeutung der SH2-Domänen von Janus-Kinasen und STAT-Faktoren bei der Signaltransduktion von IL-6-Typ-Zytokinen
Janus 激酶和 STAT 因子的 SH2 结构域在 IL-6 型细胞因子信号转导中的重要性
  • 批准号:
    5399388
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Rekonstruktion der spätpleistozänen und holozänen Hydrographie in der nördlichen Badain Jaran Shamo NW-China
巴丹吉林沙漠北部晚更新世和全新世水文重建
  • 批准号:
    5405416
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Research Grants
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了