Study on High Accuracy for Historical Character Recognition

高精度历史人物识别研究

基本信息

项目摘要

The aim of this research is to study a high precise recognizing system for historical character recognition by applying the hand written OCR technology, in HCR project. During the research period, the building of historical character database and reconsidering for applying character recognition technology to the historical document with writing brush have been carried out as follows.(1)Character segmentation and normalization : Projection histogram and method of character shape have been studied. And, the column extraction based on the Hough transformation was revised and experimented.(2)Offline character recognition : the coordination between new segmentation method for historical document with writing brush and its recognition was considered.(3)Online character recognition : new online recognizing method for historical characters was studied based on the tablet input which would be effective for retrieving "Kuzushi" character. The electronic dictionary which can be used on Windows PC will be published in 2005.(4)A online retrieval software was developed based on the database of "Kanji Kuzushi-ji Jiten" published by Tokyo-do Publishing Company.(5)As for the character pattern dictionary for recognizing historical characters, 9 databases were released for the public use which can be downloaded from Web site. Homepage for HCR project is http://www.nichibun.ac.jp/shoji/hcr. Also, 2 software programs were opened, GetMoji macro and GetMoji for Web respectively.
本研究的目的是将手写OCR技术应用于历史文字识别项目中,研究一种高精度的历史文字识别系统。在研究过程中,对历史字库的建立和将字符识别技术应用于历史毛笔文档的再思考如下:(1)字符分割和归一化:研究了投影直方图和字符形状的方法。并对基于Hough变换的列提取方法进行了修正和实验。(2)离线字符识别:考虑了历史文档毛笔分割的新方法与其识别的协调性。(3)在线字符识别:研究了一种新的基于平板输入的历史字符在线识别方法,该方法可以有效地检索到库祖士字符。可在Windows PC上使用的电子词典将于2005年出版。(4)以东京都出版公司出版的《汉字苦祖士集》数据库为基础,开发了在线检索软件。(5)在识别历史文字的字形词典方面,发布了9个数据库供公众使用,可从网站下载。人力资源研究项目的主页是http://www.nichibun.ac.jp/shoji/hcr.同时还打开了GetMoji宏和GetMoji for Web两个软件程序。

项目成果

期刊论文数量(46)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
非線形正規化を応用した学習パターン生成による手書き文字認識
使用非线性归一化的学习模式生成进行手写字符识别
古文書を対象にした文字認識の研究
古文献文字识别研究
  • DOI:
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山田奨治;柴山 守
  • 通讯作者:
    柴山 守
松本隆一, 増田好克, 柴山 守: "古文書におけるHough変換を用いた行抽出手法の提案"平成16年度電気学会全国大会講演論文集. 109-109 (2004)
Ryuichi Matsumoto、Yoshikatsu Masuda、Mamoru Shibayama:“古代文献中使用霍夫变换的线提取方法的提议”日本电气工程师学会 2004 年全国会议记录 109-109(2004)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
川口洋: "『江戸時代における人口分析システム(DANJUR0 ver.20)』の構築・運用・利用"帝塚山大学学術論集. 9. 1-27 (2002)
川口博:“‘江户时代人口分析系统(DANJUR0 ver.20)’的构建、操作和使用”手冢山大学学术评论9. 1-27 (2002)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
類似文字検索機能をそなえた電子くずし字辞典の開発
具有相似字检索功能的电子葛字词典的研制
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

SHIBAYAMA Mamoru其他文献

Inter-institutional Database Unification by Meatadata--Standardization for Humanities Data Sharing--
元数据跨机构数据库统一--人文数据共享标准化--
Hanoi Urban Transition in 19-21 Centuries, an Area Informatics Approach
19-21世纪河内城市转型,一种区域信息学方法
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kimikazu Sasa;Yuki Matsushi;Yuki Tosaki;Michiko Tamari;Tsutomu Takahashi;Yasuo Nagashima;Kazuho Horiuchi;Hiroyuki Matsuzaki;Yasuyuki Shibata;Motohiro Hirabayashi;Hideaki Motoyama;Takumaro KIMURA;鳴海 邦匡;藤原辰史;神崎直美;加賀美雅弘;CHIROSUE Masashi;近藤成一;森本 一夫;谷口昭;藤原辰史;夫馬進;木村琢麿;SHIBAYAMA Mamoru
  • 通讯作者:
    SHIBAYAMA Mamoru

SHIBAYAMA Mamoru的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('SHIBAYAMA Mamoru', 18)}}的其他基金

Spatiotemporal Analysis on Maritime Exchage Network using the Records and Documents
使用记录和文件对海上交换网络进行时空分析
  • 批准号:
    23320128
  • 财政年份:
    2011
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Hanoi's Urbanization - Dynamism of Historical Transition and Environmental Diversity
河内的城市化——历史变迁和环境多样性的动力
  • 批准号:
    23401011
  • 财政年份:
    2011
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Development of OCR system for Historical Documents and Application to Technologies in Electronic Dictionary
历史文献OCR系统开发及电子词典技术应用研究
  • 批准号:
    12558037
  • 财政年份:
    2000
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on OCR for Historical Document
历史文献OCR研究
  • 批准号:
    11410090
  • 财政年份:
    1999
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Web based systems for providing the huge historical documents in the Oriental studies
基于Web的东方学海量历史文献提供系统研究
  • 批准号:
    09551009
  • 财政年份:
    1997
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study and its application of providing system of vast multimedia information in the Oriental studies
东方学海量多媒体信息提供系统的研究及其应用
  • 批准号:
    06559010
  • 财政年份:
    1994
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Study on a text processing of multi languages for assisting the southeast asian studies
辅助东南亚研究的多语言文本处理研究
  • 批准号:
    61580023
  • 财政年份:
    1986
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

Development and improvement of a descriptive automatic scoring system incorporating handwritten character recognition
结合手写字符识别的描述性自动评分系统的开发和改进
  • 批准号:
    23H03511
  • 财政年份:
    2023
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Early-Modern Character Recognition with Generated Fonts
使用生成的字体进行早期现代字符识别
  • 批准号:
    22K21307
  • 财政年份:
    2022
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2022
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
AI-based document preprocessing for optical character recognition
基于人工智能的光学字符识别文档预处理
  • 批准号:
    567474-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Alliance Grants
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2021
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
Character Recognition of English Early Printed Books with AI-OCR
AI-OCR 英文早期印刷书籍字符识别
  • 批准号:
    20K20705
  • 财政年份:
    2020
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Research on practical Japanese handwritten character recognition method for application to deep learning
面向深度学习的实用日语手写字符识别方法研究
  • 批准号:
    20K11868
  • 财政年份:
    2020
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2020
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2019
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Discovery Grants Program - Individual
Coordinated Promotion Initiative for the Further Development of Optical Character Recognition (OCR) Techniques
进一步发展光学字符识别(OCR)技术的协调推进计划
  • 批准号:
    409784275
  • 财政年份:
    2018
  • 资助金额:
    $ 7.68万
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了