文書認識の完全自動化

全自动文档识别

基本信息

  • 批准号:
    08458072
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    1996
  • 资助国家:
    日本
  • 起止时间:
    1996 至 1997
  • 项目状态:
    已结题

项目摘要

本年度の研究では、当初の目的であった。完全自動文書認識システムを完成させるまでに至らなかったが、次の成果を得た。これらを基礎にして展開研究を計画している。1.文字パターンの特徴量空間である196次元ベクトル空間において、各字種の特徴量の集まりを正2^N面体型特徴領域と2^N面体型特徴領域との共通部分として定め、字種間相互の特徴領域の重なりを調べた。2^N面体型特徴領域はマハラノビス距離による超球型特徴領域の近似であり、線形計画法を用いて重なりを調べるために導入した。調べた結果、1字種の特徴領域と重なる特徴領域を持つ字種数が平均79であることがわかった。これは、単純なマンハッタン距離を用いた正2^N面体型特徴領域だけによるものに較べて約1/5になっているが、まだ、重なりが大きいことを意味している。2.文字の特徴領域の重なりが類似文字に起因することに着目し、類似文字であるかどうかの判定法を考え、類似文字間の識別法としてその相違部分を重視する方法を考案した。また、低品質文字の認識のため、動的重み付き単純類似度を考え、つぶれ度による文字品質の判定により、品質に応じた識別手法を適用することで、より高精度な認識ができることを明らかにした。3.日本語文字列の生成確率モデルとして文字trigram-単語trigramの複合モデルを考え、これを用いて誤りを含む認識結果候補文字列からより正しいもの選択する手法を開発した。4.文書レイアウト解析については、必ずしも長方形ではない文章ブロックを抽出する方法を考案し、実験により検証した。
This year's research is aimed at the original goal. Fully automatic document recognition is completed. This is the foundation for the development of research projects. 1. The feature space of characters is 196-dimensional. The feature space of characters is 196-dimensional. 2. N-type feature fields are similar to each other in terms of distance. The average number of characters in a character field is 79. The distance between the two surfaces is about 1/5 of the distance between the two surfaces. 2. A study on the method of determining the cause of similar characters in the character field and the method of recognizing the contrary part of similar characters The recognition of low-quality characters is based on the analysis of pure similarity, the determination of character quality, and the application of high-precision recognition. 3. Japanese character string generation accuracy test, test 4. The method of extracting the document from the rectangle is examined and verified.

项目成果

期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
大町真一郎, 阿曽弘具: "品質を考慮した印刷文字認識手法" 情報処理学会論文誌. 38・12. 2490-2498 (1997)
Shinichiro Omachi、Hirogu Aso:“考虑质量的印刷字符识别方法”,日本信息处理学会汇刊 38・12(1997 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
H. MORI, H. ASO, S. MAKINO: "Robust n-Gram Model of Japanese Character and its Application to Document Recognition" IEICE Trans. Information and Systems. E74D・5. 471-476 (1996)
H. MORI、H. ASO、S. MAKINO:“日语字符的鲁棒 n-Gram 模型及其在文档识别中的应用”IEICE Trans. 471-476 (1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M. SUZUKI, N. KATO, H. ASO, Y. NEMOTO: "A Handprinted Character Recognition System Using Image Transformation Based on Partial Inchination Detection" IEICE Trans. Information and Systems. E79D・5. 504-509 (1996)
M. SUZUKI、N. KATO、H. ASO、Y. NEMOTO:“基于部分刻印检测的手印字符识别系统”IEICE Trans. 504-509。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
F. Sun, S. OMACHI, H. ASO: "Precise Selection of Candidates for Handwritten Character Recognition Using Feature Regions" IEICE Trans. Information and Systems. E79D・5. 510-515 (1996)
F. Sun、S. OMACHI、H. ASO:“使用特征区域精确选择手写字符识别”IEICE Trans. 510-515。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
大町真一郎,阿曽弘具: "つぶれを考慮した低品質印刷文字の高精度認識" 電子情報通信学会論文誌(D-II). J79D-II・9. 1534-1542 (1996)
Shinichiro Omachi、Hirogu Aso:“考虑失真的低质量印刷字符的高精度识别”电子、信息和通信工程师学会会刊(D-II)1534-1542(1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

阿曽 弘具其他文献

"切り出しを同時に行う孤立文字認識法"
“同时提取的孤立字符识别方法”
ビデオ映像からの文字列抽出手法
视频片段中字符串的提取方法
"補間処理手法の簡略化による折れ線グラフ画像の高速認識"
《通过简化插值处理方法实现线图图像的高速识别》
On Precise Pattern Recognition by Integrating Recognition Algorithms
集成识别算法的精确模式识别
On the Bias of Predictive Distribution in Pattern Recognition
模式识别中预测分布的偏差
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野田口 玄;大町 真一郎;阿曽 弘具;杉山貴也;Sarunas Raudys;岩村 雅一;安達 則男;Hideaki Goto;根岸 和也;根岸 和也;Takaya Sugiyama;Sarunas Raudys;Masakazu Iwamura
  • 通讯作者:
    Masakazu Iwamura

阿曽 弘具的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('阿曽 弘具', 18)}}的其他基金

学習・適応機能を有する機構の実現に関する研究
具有学习和自适应功能的机制实现研究
  • 批准号:
    X00095----365122
  • 财政年份:
    1978
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (D)

相似海外基金

手書き文字認識を組み込んだ記述式自動採点システムの開発と改良
结合手写字符识别的描述性自动评分系统的开发和改进
  • 批准号:
    23K28201
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development and improvement of a descriptive automatic scoring system incorporating handwritten character recognition
结合手写字符识别的描述性自动评分系统的开发和改进
  • 批准号:
    23H03511
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
少量の実データに基づく画像内文字認識及びその応用
基于少量真实数据的图像字符识别及其应用
  • 批准号:
    22KJ0905
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
並行AIモデルによる手書き英作文の文字認識自動採点システムの開発
利用并行AI模型开发手写英语作文字符识别自动评分系统
  • 批准号:
    22K02917
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Early-Modern Character Recognition with Generated Fonts
使用生成的字体进行早期现代字符识别
  • 批准号:
    22K21307
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Discovery Grants Program - Individual
AI-based document preprocessing for optical character recognition
基于人工智能的光学字符识别文档预处理
  • 批准号:
    567474-2021
  • 财政年份:
    2021
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Alliance Grants
Computational Analysis of Handwriting, Character Recognition, and Design of Digital Fonts
手写计算分析、字符识别和数字字体设计
  • 批准号:
    RGPIN-2019-07005
  • 财政年份:
    2021
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Discovery Grants Program - Individual
Character Recognition of English Early Printed Books with AI-OCR
AI-OCR 英文早期印刷书籍字符识别
  • 批准号:
    20K20705
  • 财政年份:
    2020
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Research on practical Japanese handwritten character recognition method for application to deep learning
面向深度学习的实用日语手写字符识别方法研究
  • 批准号:
    20K11868
  • 财政年份:
    2020
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了