Development of a semi-automatic open source tool for layout analysis and region extraction and region classificiation (LAREX) of early prints.
开发半自动开源工具,用于早期印刷品的布局分析以及区域提取和区域分类(LAREX)。
基本信息
- 批准号:394329162
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:德国
- 项目类别:Research data and software (Scientific Library Services and Information Systems)
- 财政年份:2018
- 资助国家:德国
- 起止时间:2017-12-31 至 2019-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The goal of the proposal is the further development of our efficient, semi-automatic and easy-to-use open-source segmentation tool LAREX und its integration in the open source workflow of the OCR-D functional model. The preliminary work LAREX (Layout Analysis and Region EXtraction) allows both a coarse segmentation by separation of text and non-text and a fine segmentation by detection and classification of different textual entites. LAREX utilizes an efficient implementation of the connected component approach. It has been used in the digitalization of different early prints und enables a qualitative good page segmentation with significantly less time than conventional alternatives. The main goal of the further development of LAREX is to reduce the degree of manual work. Therefore, a more robust segmentation und a further development of the rule and constraint language are necessary. The basic configurations should be easily adaptable to the peculiarities of a particular early print by both the users and learning algorithms. Furthermore, the comfortable GUI of LAREX for correction of single segmentation errors should be improved. This component is also necessary for defining a ground truth for learning algorithms and for evaluation. The overall goal is to find an optimal combination between manual and automatic methods. The tool and the process model will be substantially evaluated with various cooperation partners, in particular in the context of the digitalization of early prints within the OCR-D function model including the subsequent OCR by the linkage of external tools.
该提案的目标是进一步开发我们的高效,半自动和易于使用的开源分割工具LAREX及其集成在开源工作流程的OCR-D功能模型。初步工作LAREX(布局分析和区域提取)允许通过分离文本和非文本进行粗分割,通过检测和分类不同的文本实体进行细分割。LAREX利用连接组件方法的有效实现。它已被用于不同的早期印刷品的数字化,并能够以比传统替代品更少的时间实现质量良好的页面分割。LAREX进一步发展的主要目标是减少手工工作的程度。因此,一个更强大的分割和进一步发展的规则和约束语言是必要的。基本配置应该容易地适应用户和学习算法的特定早期打印的特性。此外,LAREX用于校正单个分割错误的舒适的GUI应得到改进。这个组件对于定义学习算法和评估的基础事实也是必要的。总体目标是找到手动和自动方法之间的最佳组合。将与各种合作伙伴一起对工具和流程模型进行实质性评估,特别是在OCR-D功能模型内的早期印刷品数字化的背景下,包括随后通过外部工具链接的OCR。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Professor Dr. Frank Puppe其他文献
Professor Dr. Frank Puppe的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Professor Dr. Frank Puppe', 18)}}的其他基金
Adaptive Koordination klinischer Behandlungsprozesse durch kooperierende Softwareagenten
通过协作软件代理自适应协调临床治疗过程
- 批准号:
5245976 - 财政年份:2000
- 资助金额:
-- - 项目类别:
Priority Programmes
相似国自然基金
DoS攻击下Semi-Markov跳变拓扑结构网络化协同运动系统预测控制研究
- 批准号:
- 批准年份:2024
- 资助金额:15.0 万元
- 项目类别:省市级项目
隐semi-Markov过程驱动的双时间尺度时滞系统有限时间控制
- 批准号:62303016
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
具有脉冲效应的正semi-Markov跳变系统的分析与控制
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
广义离散网络semi-Markov跳变系统的事件触发滑模控制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于semi-Markov过程的奇异摄动模糊跳变系统分析与综合
- 批准号:
- 批准年份:2021
- 资助金额:58 万元
- 项目类别:面上项目
不确定非齐次semi-Markov跳变系统的约束预测控制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
复杂受限的semi-Markov跳变系统控制与滤波
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于semi-Markov理论的含多类型异质能源微电网态势感知研究
- 批准号:
- 批准年份:2020
- 资助金额:57 万元
- 项目类别:面上项目
旋转对称密码函数的构造和分析
- 批准号:61902314
- 批准年份:2019
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
Semi-Markovian切换系统的动态滑模控制及逗留时间和模式依赖滑模控制器研究
- 批准号:61973075
- 批准年份:2019
- 资助金额:59.0 万元
- 项目类别:面上项目
相似海外基金
Interactive Semi-automatic Generation And Assessment Of Design Alternatives In Engineering
工程中设计方案的交互式半自动生成和评估
- 批准号:
2891552 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Studentship
Semi-automatic vacuum waferprober system
半自动真空晶圆探针系统
- 批准号:
525293842 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Major Research Instrumentation
Elements: Basil: A Tool for Semi-Automatic Containerization, Deployment, and Execution of Scientific Applications on Cloud Computing and Supercomputing Platforms
要素:Basil:在云计算和超级计算平台上半自动容器化、部署和执行科学应用程序的工具
- 批准号:
2314203 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Standard Grant
Elements: Basil: A Tool for Semi-Automatic Containerization, Deployment, and Execution of Scientific Applications on Cloud Computing and Supercomputing Platforms
要素:Basil:在云计算和超级计算平台上半自动容器化、部署和执行科学应用程序的工具
- 批准号:
2209946 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Standard Grant
Semi-automatic Data Tours to Support Data Exploration and Visualisation Literacy for Novice Analysts
半自动数据之旅支持新手分析师的数据探索和可视化素养
- 批准号:
EP/V010662/1 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Research Grant
Semi-Automatic Probe System
半自动探针系统
- 批准号:
467419131 - 财政年份:2021
- 资助金额:
-- - 项目类别:
Major Research Instrumentation
Semi-automatic Generation of English Dialogue Scenarios Based on Service Process Model
基于服务流程模型的英语对话场景半自动生成
- 批准号:
20K23353 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Research Activity Start-up
Development of a Semi-Automatic Scoring System using AI
利用人工智能开发半自动评分系统
- 批准号:
20K00797 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
Semi-automatic wafer probe station
半自动晶圆样品台
- 批准号:
450639102 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Major Research Instrumentation
Development of a weaving machine that enables semi-automatic fabrication of textile structural actuators
开发能够半自动制造纺织结构执行器的织机
- 批准号:
19K14944 - 财政年份:2019
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists