Study on High Accuracy for Historical Character Recognition

高精度历史人物识别研究

基本信息

项目摘要

The aim of this research is to study a high precise recognizing system for historical character recognition by applying the hand written OCR technology, in HCR project. During the research period, the building of historical character database and reconsidering for applying character recognition technology to the historical document with writing brush have been carried out as follows.(1)Character segmentation and normalization : Projection histogram and method of character shape have been studied. And, the column extraction based on the Hough transformation was revised and experimented.(2)Offline character recognition : the coordination between new segmentation method for historical document with writing brush and its recognition was considered.(3)Online character recognition : new online recognizing method for historical characters was studied based on the tablet input which would be effective for retrieving "Kuzushi" character. The electronic dictionary which can be used on Windows PC will be published in 2005.(4)A online retrieval software was developed based on the database of "Kanji Kuzushi-ji Jiten" published by Tokyo-do Publishing Company.(5)As for the character pattern dictionary for recognizing historical characters, 9 databases were released for the public use which can be downloaded from Web site. Homepage for HCR project is http://www.nichibun.ac.jp/shoji/hcr. Also, 2 software programs were opened, GetMoji macro and GetMoji for Web respectively.
本研究的目的是在HCR项目中,应用手写OCR技术,研究一个高精度的历史文字识别系统。在研究过程中,对历史文字数据库的建立和文字识别技术在毛笔历史文献中的应用进行了反思。(1)字符分割和归一化:研究了投影直方图和字符形状的提取方法。对基于Hough变换的柱提取法进行了改进和实验。(2)脱机字符识别:考虑了毛笔历史文献的新分割方法与其识别之间的协调。(3)联机文字识别:研究了基于手写板输入的历史文字联机识别新方法,该方法能有效地检索“苦字”。可在Windows PC上使用的电子词典将于2005年出版。(4)A基于东京出版社出版的《KANJIKUZUSHIJITEN》数据库开发了在线检索软件。(5)As在识别历史文字的字模词典方面,公开了9个数据库,可从网站下载。HCR项目的主页是http://www.nichibun.ac.jp/shoji/hcr。此外,还打开了2个软件程序,分别为GetMoji macro和GetMoji for Web。

项目成果

期刊论文数量(46)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
非線形正規化を応用した学習パターン生成による手書き文字認識
使用非线性归一化的学习模式生成进行手写字符识别
古文書を対象にした文字認識の研究
古文献文字识别研究
  • DOI:
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山田奨治;柴山 守
  • 通讯作者:
    柴山 守
松本隆一, 増田好克, 柴山 守: "古文書におけるHough変換を用いた行抽出手法の提案"平成16年度電気学会全国大会講演論文集. 109-109 (2004)
Ryuichi Matsumoto、Yoshikatsu Masuda、Mamoru Shibayama:“古代文献中使用霍夫变换的线提取方法的提议”日本电气工程师学会 2004 年全国会议记录 109-109(2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
川口洋: "『江戸時代における人口分析システム(DANJUR0 ver.20)』の構築・運用・利用"帝塚山大学学術論集. 9. 1-27 (2002)
川口博:“‘江户时代人口分析系统(DANJUR0 ver.20)’的构建、操作和使用”手冢山大学学术评论9. 1-27 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
類似文字検索機能をそなえた電子くずし字辞典の開発
具有相似字检索功能的电子葛字词典的研制
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

SHIBAYAMA Mamoru其他文献

Inter-institutional Database Unification by Meatadata--Standardization for Humanities Data Sharing--
元数据跨机构数据库统一--人文数据共享标准化--
Hanoi Urban Transition in 19-21 Centuries, an Area Informatics Approach
19-21世纪河内城市转型,一种区域信息学方法
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kimikazu Sasa;Yuki Matsushi;Yuki Tosaki;Michiko Tamari;Tsutomu Takahashi;Yasuo Nagashima;Kazuho Horiuchi;Hiroyuki Matsuzaki;Yasuyuki Shibata;Motohiro Hirabayashi;Hideaki Motoyama;Takumaro KIMURA;鳴海 邦匡;藤原辰史;神崎直美;加賀美雅弘;CHIROSUE Masashi;近藤成一;森本 一夫;谷口昭;藤原辰史;夫馬進;木村琢麿;SHIBAYAMA Mamoru
  • 通讯作者:
    SHIBAYAMA Mamoru

SHIBAYAMA Mamoru的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('SHIBAYAMA Mamoru', 18)}}的其他基金

Spatiotemporal Analysis on Maritime Exchage Network using the Records and Documents
使用记录和文件对海上交换网络进行时空分析
  • 批准号:
    23320128
  • 财政年份:
    2011
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Hanoi's Urbanization - Dynamism of Historical Transition and Environmental Diversity
河内的城市化——历史变迁和环境多样性的动力
  • 批准号:
    23401011
  • 财政年份:
    2011
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Development of OCR system for Historical Documents and Application to Technologies in Electronic Dictionary
历史文献OCR系统开发及电子词典技术应用研究
  • 批准号:
    12558037
  • 财政年份:
    2000
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on OCR for Historical Document
历史文献OCR研究
  • 批准号:
    11410090
  • 财政年份:
    1999
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Web based systems for providing the huge historical documents in the Oriental studies
基于Web的东方学海量历史文献提供系统研究
  • 批准号:
    09551009
  • 财政年份:
    1997
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study and its application of providing system of vast multimedia information in the Oriental studies
东方学海量多媒体信息提供系统的研究及其应用
  • 批准号:
    06559010
  • 财政年份:
    1994
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Study on a text processing of multi languages for assisting the southeast asian studies
辅助东南亚研究的多语言文本处理研究
  • 批准号:
    61580023
  • 财政年份:
    1986
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

Development and improvement of a descriptive automatic scoring system incorporating handwritten character recognition
结合手写字符识别的描述性自动评分系统的开发和改进
  • 批准号:
    23H03511
  • 财政年份:
    2023
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Early-Modern Character Recognition with Generated Fonts
使用生成的字体进行早期现代字符识别
  • 批准号:
    22K21307
  • 财政年份:
    2022
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2022
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
AI-based document preprocessing for optical character recognition
基于人工智能的光学字符识别文档预处理
  • 批准号:
    567474-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Alliance Grants
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2021
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
Character Recognition of English Early Printed Books with AI-OCR
AI-OCR 英文早期印刷书籍字符识别
  • 批准号:
    20K20705
  • 财政年份:
    2020
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2020
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
Research on practical Japanese handwritten character recognition method for application to deep learning
面向深度学习的实用日语手写字符识别方法研究
  • 批准号:
    20K11868
  • 财政年份:
    2020
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2019
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
Coordinated Promotion Initiative for the Further Development of Optical Character Recognition (OCR) Techniques
进一步发展光学字符识别(OCR)技术的协调推进计划
  • 批准号:
    409784275
  • 财政年份:
    2018
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了