文書認識システムの汎用性の向上と全自動化に関する研究
提高证件识别系统通用性和全自动化的研究
基本信息
- 批准号:08780324
- 负责人:
- 金额:$ 0.64万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1996
- 资助国家:日本
- 起止时间:1996 至 1997
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は、複雑なレイアウトの文書も取り扱えるような汎用性の高い文書画像解析処理の実現であった。まず文字行の配置方向を検出する手法について理論的・実験的に検討を行った。文書画像上の黒画素の連結成分に対する外接矩形の配置を局所的に評価し、画像の局所領域における文字行の傾きを検出する手法を開発した。既開発の文字行抽出処理(区分直線連結法)を併用して評価実験を行った結果、一枚の文書上の複数の文字行の方向が一致していない場合でも効率的かつ高精度な文字行の抽出ができることが確認された。本手法は漢字やカナ、アルファベットといった文字の種類に依存しない処理であり、実験により日本語・英語混在文書への適用も可能であることが示された。なお、日本語の文書では縦書きと横書きの文章領域が混在することがあり、文字行の正しい方向を検出する必要がある。文字行中の一部の文字をサンプルとして文字認識処理にかけ、文字の類似度を縦方向と横方向で比較することで、方向検出が可能となった。本処理と先の傾き検出の処理を組み合わせて、文字行の正しい配置方向を検出する系統的な手法を開発した。次に、複数の文字行の相対位置関係を評価することによって、文字行候補を結合し、文章ブロックを構成する手法を開発した。本手法では、文字行の高さと長さ、行間距離、重なりの割合といった、記述文字(言語)に依存しない局所的なパラメータのみを結合の評価に用いており、文書全体のレイアウトに関する事前知識をほとんど利用していない。その結果、矩形やL字形に限らず、非矩形の文章ブロックも抽出でき、文章領域と図・写真などが入り組むような複雑なレイアウトの文書も取り扱える処理が実現された。
The purpose of this study is to analyze and process the image of the document with high versatility. The direction of arrangement of the lines of characters and the techniques of writing are the theoretical and practical aspects of the writing. On the document portrait, the connection component of the black picture elements is the layout of the surrounding rectangle, the bureau's bureau's bureau's bureau, and the bureau's field of the portrait is the character line の tilting きを検出 する technique を开発した. The result of the existing character line extraction processing (distinguished straight line connection method) and the result of the same line and the plural number on one piece of paper are used together. The direction of the character line is consistent and the situation is efficient. The extraction of the character line is high-precision and the confirmation is done. This technique is based on the processing of Kanji やカナ and アルファベットといったcharacter types depending on the type.あり、実験によりJapanese and English are mixed in the document. It is applicable and possible.なお, 日本语の书では縦书きとlateral book きのArticle field がmixed in することがあり, 文行の正しいdirectional を検出するNecessary がある. The characters in the line are part of the character, the characters are recognized and processed, the characters are similar, the characters are similar, the direction is horizontal, the direction is compared, the direction is drawn, the direction is possible, and the direction is possible. This processing is based on the system's method of arranging the direction of the text line and the arrangement of the system. Time に, plural のcharacter line の相対 positional relationship するすることによって, character line candidate をcombination し, article ブロックを constitute するtechnique を开発した. The method of writing, the height and length of character lines, the distance between lines, the importance of cutting and combining, and the dependence of written characters (speech) on the structure of the text.パラメータのみをcombination of the evaluation of the use of the いており, the whole document of the のレイアウトに关するprior knowledge of the use of していない.その results, rectangular L-shaped にlimit らず, non-rectangular article ブロックも extraction でき, article field と図・The photo is taken out of the photo and it is processed by the group.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
後藤 英昭其他文献
ウェアラブルカメラのための景観中文字の抽出・追跡手法(MR/ARの実用化に向けたCV/PR技術の課題と展望)
可穿戴相机的风景人物提取与跟踪方法(CV/PR技术在MR/AR实用化中的挑战与展望)
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
王 秉華;後藤 英昭 - 通讯作者:
後藤 英昭
後藤 英昭的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('後藤 英昭', 18)}}的其他基金
分散・協調文書認識環境の構築に関する研究
构建分布式协作文档识别环境的研究
- 批准号:
18650036 - 财政年份:2005
- 资助金额:
$ 0.64万 - 项目类别:
Grant-in-Aid for Exploratory Research














{{item.name}}会员




