文字認識における辞書のマルチテンプレート化に関する研究

多模板词典字符识别研究

基本信息

  • 批准号:
    06780296
  • 负责人:
  • 金额:
    $ 0.51万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では文字認識の高速化・高精度化を目指し、総カテゴリー数が少なく高精度な辞書を作成する手法の考案を目的としている。本研究は主に、文字特徴量の統計的性質の解析、マルチテンプレート化の手法の検討、開発した手法の妥当性の検証の3つの柱から成っていた。以下、それぞれについて研究実績を述べる。1.文字特徴量の統計的性質の解析文字特徴量の分布として、同じ字種の集合内での分布(級内分布)と、字種間の分布、すなわち空間上で各字種の特徴量の重心(あるいは中心)がどのように分布しているか(級間変動)を、多変量統計解析の手法(主成分分析等)を用いて調べた。その結果文字特徴量について、(1)字種内の分布の広がりに対して字種間の分布はかなり密であること、(2)字種内の分布はかなり偏っていること、(3)領域が重なっている字種対は少ないこと、(4)字種ごとに主成分の方向が大きく異なること、等が分かった。2.マルチテンプレート化の手法の検討1.で明らかになった文字特徴量の分布状況を考慮し、マルチテンプレート化の手法を検討した。そして、まず字種ごとの学習パターンから得られた特徴量の集合をそれぞれ一つのカテゴリーとみなし、分割の必要のあるカテゴリーを分割していくことでマルチテンプレートの辞書を作成する手法を考案した。分割が必要かどうかは、文字特徴量の分布形状をもとに誤認識が生じる可能性があるか否かで判断する。ただし、辞書作成には、分割に用いるクラスタリング法が重要な役割を持つことが分かった。より高精度な辞書を作成できるクラスタリング法の検討は今後の課題である。3.手法の妥当性の検証2.で考案した手法の有効性を確かめるため、実際の文字パターンに適用し、辞書作成および認識の実験を行った。その結果、従来法と比較し、総カテゴリー数が同程度の場合本手法で作成した辞書を用いた方が高い認識率を得ることができた。
The purpose of this study is to speed up and increase the accuracy of character recognition, to increase the number of characters and to create a high-precision dictionary. The main purpose of this study is the analysis of the statistical properties of text characteristics and the transformation of malformation The appropriateness of the technique is as follows: the appropriateness of the technique is ascertained. Below, I will describe the results of my research. 1. Analysis of the statistical properties of character characteristics: distribution of character characteristics, distribution within a set of the same character type (distribution within a class), distribution between character types, and spatial distribution of character characteristics Character type の special value の center of gravity (あるいは center) がどのように distribution しているか (inter-level dimensional movement) を, multi-dimensional statistical analysis techniques (principal component analysis, etc.) を いて Adjustment べた.その Result Character Characteristics について, (1) Distribution within the character type の広がりに対してThe distribution among the characters is the same as the density of characters, (2) The distribution within the characters is the same Partial っていること, (3) Area が重なっているcharacter type対は小ないこと, (4) The main component of the character type is ごとにの大きくdifferent なること, equal が分かった. 2.で明らかになったcharacteristics The distribution status of the amount is considered, and the method of malformation is used.そして, まずcharacter type ごとの学パターンからget られた特徴quantityの集をそれぞれ一つのカテゴリーとみなし, Necessary division of division していくことでマルチテンプレートのdictionary を成するtechniqueをtest caseした. Necessity of segmentation, distribution shape of character characteristics, misrecognition of misunderstanding, probability of occurrence, and judgment of whether or not.ただし、dictionary makingには、divided いるクラスタリング法がimportantなservice cutをholdつことが分かった. This is a high-precision dictionary that has been compiled using a high-precision dictionary. 3. Proof of the validity of the technique 2. Proof of validity of the technique in the case study , 実记の字パターンにapplicableし, dictionary makingおよびknowledgeの実験を行った. The result, the method of comparison, the method of comparison, the number of cases with the same degree, the method of making the dictionary, the use of the method, the high recognition rate, and the result.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

大町 真一郎其他文献

身体技能情報の再構築化による初級者学習支援手法の提案
提出通过重建身体技能信息来为初学者提供学习支持方法
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大谷 昌輝;菅谷 至寛;宮崎 智;大町 真一郎;松浦 慶総
  • 通讯作者:
    松浦 慶総
屋内撮影画像中の案内板までの実距離推定手法の検討
室内拍摄图像导板实际距离估计方法研究
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    竹村 貴文;菅谷 至寛;宮崎 智;大町 真一郎
  • 通讯作者:
    大町 真一郎
"補間処理手法の簡略化による折れ線グラフ画像の高速認識"
《通过简化插值处理方法实现线图图像的高速识别》
On Precise Pattern Recognition by Integrating Recognition Algorithms
集成识别算法的精确模式识别
On the Bias of Predictive Distribution in Pattern Recognition
模式识别中预测分布的偏差
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野田口 玄;大町 真一郎;阿曽 弘具;杉山貴也;Sarunas Raudys;岩村 雅一;安達 則男;Hideaki Goto;根岸 和也;根岸 和也;Takaya Sugiyama;Sarunas Raudys;Masakazu Iwamura
  • 通讯作者:
    Masakazu Iwamura

大町 真一郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('大町 真一郎', 18)}}的其他基金

関数のあてはめによる動画像からの物体の抽出と3次元形状の復元
从视频图像中提取对象并通过拟合函数恢复 3D 形状
  • 批准号:
    14780256
  • 财政年份:
    2002
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
文字認識における劣化文字の分析及び高精度認識法に関する研究
字符识别中劣化字符分析及高精度识别方法研究
  • 批准号:
    10780216
  • 财政年份:
    1998
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
高精度文字認識のためのカテゴリー間分布を考慮したクラスタリング手法に関する研究
考虑类别间分布的高精度字符识别聚类方法研究
  • 批准号:
    08780323
  • 财政年份:
    1996
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

中世イロハ引き日本語辞書における見出し掲出システムについての研究
中世纪日语词典标题显示系统研究
  • 批准号:
    24K03931
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
辞書サイト・アプリ開発に資する質の高い日本語例文バンクの構築とその応用研究
构建有助于词典网站/应用程序开发及其应用研究的高质量日语例句库
  • 批准号:
    23K20470
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ケラビット語のオンライン辞書構築
克拉比特语在线词典的构建
  • 批准号:
    24KJ1814
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
辞書式圧縮と圧縮情報処理の深化
字典压缩与压缩信息处理的深化
  • 批准号:
    24K02899
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日本古辞書ポータルサイトの開発による公開研究資源の高度利用
通过开发古代日语词典门户网站,充分利用公共研究资源
  • 批准号:
    24K16080
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
幕末明治期における辞書体資料の受容に関する研究
江户末期和明治时期词典资料的接受研究
  • 批准号:
    24K16088
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
中日バイリンガル(Logographic Bilinguals)の心的辞書における音韻表象の解明
中日双语者心理词汇中语音表征的阐释(语标双语者)
  • 批准号:
    24K06615
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
芸術・文化財情報流通のための多言語辞書データ開発の研究
艺术品文化财产信息发布多语言词典数据开发研究
  • 批准号:
    23K22017
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
医療用語のエンティティリンキングに向けた実践的医療用語辞書の開発
开发用于医学术语实体链接的实用医学术语词典
  • 批准号:
    23K28182
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
専門語彙成長モデルの構築と多言語専門用語辞書拡張への応用
专业词汇增长模型构建及其在多语种专业术语词典扩充中的应用
  • 批准号:
    24H00736
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了