Developing a Historical Document Analysis System Using Hand-written OCR Techomology

使用手写 OCR 技术开发历史文档分析系统

基本信息

项目摘要

In this research project, we could obtain the following results. (1) The basic research on the Historical Character Recognition. We examined on some special requirements for the character recognition and segmentation of historical characters. By using a small data set of historical characters, we obtained 95 percents of correct recognition ratio applying Japanese hand-written character recognition technology. We also developed some new technology of segmentation and normalization of historical characters. (2) Historical character database for recognition studies. We made some database to put the study of historical character recognition into progress. The database contain over 250 thousands characters. (3) Interface prototyping of historical document analyzing system. We developed prototype systems of historical document analyzing system. One is a system with a function of presenting correct character candidates of unreadable character using n-gram information. The other is a prototype system of electrical dictionary for historical characters. The dictionary has a function of similar character search, which is an application of hand-written character recognition.
在这个研究项目中,我们可以得到以下结果。(1)历史文字识别的基础研究。研究了历史文字识别和分割的一些特殊要求。通过使用少量的历史汉字数据集,采用日文手写汉字识别技术,获得了95%的正确率。我们还开发了一些新的历史文字分割和规范化技术。(2)用于识别研究的历史汉字数据库。我们建立了一些数据库,推动了历史汉字识别的研究。该数据库包含超过25万个字符。(3)历史文献分析系统界面原型。我们开发了历史文献分析系统的原型系统。一种是具有使用n-gram信息表示不可读字符的正确字符候选函数的系统。二是历史文字电词典的原型系统。该词典具有相似字符搜索功能,是手写体字符识别的一种应用。

项目成果

期刊论文数量(28)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Kouji Ozaki, Mamoru Shibayama et. al.: "Komonjo Gazou no Hyoudai Moji Segmentation"Jinbunkagakuto Computer Symposium Ronbunsyu. 2000. 279-286 (2000)
尾崎浩司、柴山守等。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
山田奨治, 柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム論文集. 2000. 185-192 (2000)
Shoji Yamada、Mamoru Shibayama:“使用 n-gram 对古代文档和文档转录的支持研究”2000 年人文与计算机研讨会论文集。185-192 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
山田奨治ほか: "古文書翻刻支援システム(HCR)開発プロジェクト報告(2)"情報処理学会研究報告. 2001,51. 9-16 (2001)
Shoji Yamada等:“古代文献复制支持系统(HCR)开发项目报告(2)”日本信息处理学会研究报告2001,51.9-16(2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

YAMADA Shoji其他文献

YAMADA Shoji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('YAMADA Shoji', 18)}}的其他基金

Different effects of enantiomers of beta2-adrenergic agonist on muscle and bone.
β2-肾上腺素能激动剂对映体对肌肉和骨骼的不同影响。
  • 批准号:
    22592077
  • 财政年份:
    2010
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Infrastructure Development for Historical Time-spatial Data Mning to Modern Japan
近代日本历史时空数据挖掘基础设施建设
  • 批准号:
    19200019
  • 财政年份:
    2007
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Development of Data Mining Resources for Knowledge Discovery of Pre-Modern Japanese Concepts
开发用于前现代日本概念知识发现的数据挖掘资源
  • 批准号:
    16200018
  • 财政年份:
    2004
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Effect of VEGF's on osteockast formation and activation
VEGF 对骨细胞形成和激活的影响
  • 批准号:
    13671950
  • 财政年份:
    2001
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Knowlaedge information analysis of Historical Document Understanding
历史文献理解的知识信息分析
  • 批准号:
    11480082
  • 财政年份:
    1999
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Effect of CFS-1 on osteoclast and its precursor cells
CFS-1对破骨细胞及其前体细胞的影响
  • 批准号:
    07672028
  • 财政年份:
    1995
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A development of repetitious mechanical stress loading system for cultured cells.
培养细胞重复机械应力加载系统的开发。
  • 批准号:
    03557078
  • 财政年份:
    1991
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
Improvement of Characteristics of Complementary Elactrochromic Devices by the Use of Various Transition-Metal-Oxide Films
使用各种过渡金属氧化物薄膜改善互补电致变色器件的特性
  • 批准号:
    01550010
  • 财政年份:
    1989
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

Development and improvement of a descriptive automatic scoring system incorporating handwritten character recognition
结合手写字符识别的描述性自动评分系统的开发和改进
  • 批准号:
    23H03511
  • 财政年份:
    2023
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Early-Modern Character Recognition with Generated Fonts
使用生成的字体进行早期现代字符识别
  • 批准号:
    22K21307
  • 财政年份:
    2022
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2022
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Discovery Grants Program - Individual
AI-based document preprocessing for optical character recognition
基于人工智能的光学字符识别文档预处理
  • 批准号:
    567474-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Alliance Grants
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2021
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Discovery Grants Program - Individual
Character Recognition of English Early Printed Books with AI-OCR
AI-OCR 英文早期印刷书籍字符识别
  • 批准号:
    20K20705
  • 财政年份:
    2020
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Research on practical Japanese handwritten character recognition method for application to deep learning
面向深度学习的实用日语手写字符识别方法研究
  • 批准号:
    20K11868
  • 财政年份:
    2020
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2020
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Discovery Grants Program - Individual
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2019
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Discovery Grants Program - Individual
Coordinated Promotion Initiative for the Further Development of Optical Character Recognition (OCR) Techniques
进一步发展光学字符识别(OCR)技术的协调推进计划
  • 批准号:
    409784275
  • 财政年份:
    2018
  • 资助金额:
    $ 6.59万
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了