Knowlaedge information analysis of Historical Document Understanding

历史文献理解的知识信息分析

基本信息

项目摘要

In this research project, we studied the following four research topics : (1) Structuring the knowledge of Historical Document Understanding, (2) Study of the Historical Chara cter Recognition using our Historical Character OCR dictionary, (3) Developing a Dictionary for Historical Character Recognition, and (4) Developing a proto-type system of a computer ized Historical Character Dictionary (1) We developed a Historical Corpus Database analyzing many loan contracts consists of 1, 300 documents and 243, 000 characters. The common and frequent expressions are extracted from the documents. By using the data, we developed a proto-type of Historical Document Analysis Supporting System using n-gram method. Through an usability test, efficiency of the interface is confirmed statistically. (2) We developed some Historical Character Recognition methods using neural network. (3) Besides the database described in (1), we made another Historical Character Database of "Kuzushi-ji Kaidoku Jiten" published from Tokyoudo Syoten, which is one of the standard dictionary. The dictionary includes 25, 000 characters. (4) We have done some basic studies and have made a proto-type system of portable electrical dictionary, which could be searched by pronunciation, shape, and stroke order.
在本研究项目中,我们进行了以下四个方面的研究:(1)历史文献理解知识的构建;(2)历史文字识别的研究;(3)历史文字识别词典的开发;(4)计算机历史文字词典原型系统的开发。(1)开发了一个历史语料库数据库,分析了1300个文档和243,000个字符组成的大量借款合同。从文档中提取常见的和频繁的表达。利用这些数据,我们开发了一个基于n元文法的历史文献分析支持系统原型。通过可用性测试,从统计上证实了该界面的有效性。(2)提出了几种基于神经网络的历史文字识别方法。(3)除(1)中所述的数据库外,我们还制作了另一个由Tokyoudo Syoten出版的《Kuzushi-ji Kaidoku Jiten》历史字库,这是标准词典之一。这部词典收录了25,000个字。(4)进行了一些基础性的研究,制作了一个可按语音、字形、笔顺进行检索的便携式电子词典原型系统。

项目成果

期刊论文数量(26)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山田奨治, 柴山守: "n-gramによる古文書証文類翻刻支援の検討"人文科学とコンピュータシンポジウム論文集. 2000. 185-192 (2000)
Shoji Yamada、Mamoru Shibayama:“使用 n-gram 对古代文档和文档转录的支持研究”2000 年人文与计算机研讨会论文集。185-192 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
山田奨治ほか: "古文書翻刻支援システム開発プロジェクト報告(1)プロジェクト概要"情報処理学会研究報告. 2000, 8. 1-8 (2000)
Shoji Yamada 等:“关于开发古代文献转录支持系统的项目报告(1)项目概述”日本信息处理学会研究报告,2000 年,8. 1-8 (2000)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
柴山守: "証文類古文書標題の文字認識辞書構築とその利用について"京都大学大型計算機センターセミナー報告. 67. 70-79 (2001)
Mamoru Shibayama:“古代文献标题的字符识别词典的构建及其使用”京都大学大型计算机中心研讨会报告 67. 70-79 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
篠原早苗ほか: "SVMによる手書き類似文字認識の学習データ選択と認識精度に関する一考察"2001年電子情報通信学会ソサイティ大会. D-12-8. 183 (2001)
Sanae Shinohara 等人:“使用 SVM 进行手写相似字符识别的训练数据选择和识别准确性的研究”2001 IEICE 协会会议 D-12-8 (2001)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

YAMADA Shoji其他文献

YAMADA Shoji的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('YAMADA Shoji', 18)}}的其他基金

Different effects of enantiomers of beta2-adrenergic agonist on muscle and bone.
β2-肾上腺素能激动剂对映体对肌肉和骨骼的不同影响。
  • 批准号:
    22592077
  • 财政年份:
    2010
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Infrastructure Development for Historical Time-spatial Data Mning to Modern Japan
近代日本历史时空数据挖掘基础设施建设
  • 批准号:
    19200019
  • 财政年份:
    2007
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Development of Data Mining Resources for Knowledge Discovery of Pre-Modern Japanese Concepts
开发用于前现代日本概念知识发现的数据挖掘资源
  • 批准号:
    16200018
  • 财政年份:
    2004
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Effect of VEGF's on osteockast formation and activation
VEGF 对骨细胞形成和激活的影响
  • 批准号:
    13671950
  • 财政年份:
    2001
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Developing a Historical Document Analysis System Using Hand-written OCR Techomology
使用手写 OCR 技术开发历史文档分析系统
  • 批准号:
    11558045
  • 财政年份:
    1999
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Effect of CFS-1 on osteoclast and its precursor cells
CFS-1对破骨细胞及其前体细胞的影响
  • 批准号:
    07672028
  • 财政年份:
    1995
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A development of repetitious mechanical stress loading system for cultured cells.
培养细胞重复机械应力加载系统的开发。
  • 批准号:
    03557078
  • 财政年份:
    1991
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
Improvement of Characteristics of Complementary Elactrochromic Devices by the Use of Various Transition-Metal-Oxide Films
使用各种过渡金属氧化物薄膜改善互补电致变色器件的特性
  • 批准号:
    01550010
  • 财政年份:
    1989
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

Development and improvement of a descriptive automatic scoring system incorporating handwritten character recognition
结合手写字符识别的描述性自动评分系统的开发和改进
  • 批准号:
    23H03511
  • 财政年份:
    2023
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Early-Modern Character Recognition with Generated Fonts
使用生成的字体进行早期现代字符识别
  • 批准号:
    22K21307
  • 财政年份:
    2022
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2022
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Discovery Grants Program - Individual
AI-based document preprocessing for optical character recognition
基于人工智能的光学字符识别文档预处理
  • 批准号:
    567474-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Alliance Grants
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2021
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Discovery Grants Program - Individual
Character Recognition of English Early Printed Books with AI-OCR
AI-OCR 英文早期印刷书籍字符识别
  • 批准号:
    20K20705
  • 财政年份:
    2020
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Research on practical Japanese handwritten character recognition method for application to deep learning
面向深度学习的实用日语手写字符识别方法研究
  • 批准号:
    20K11868
  • 财政年份:
    2020
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2020
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Discovery Grants Program - Individual
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2019
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Discovery Grants Program - Individual
Coordinated Promotion Initiative for the Further Development of Optical Character Recognition (OCR) Techniques
进一步发展光学字符识别(OCR)技术的协调推进计划
  • 批准号:
    409784275
  • 财政年份:
    2018
  • 资助金额:
    $ 6.72万
  • 项目类别:
    Research data and software (Scientific Library Services and Information Systems)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了