文字認識における辞書のマルチテンプレート化に関する研究

多模板词典字符识别研究

基本信息

  • 批准号:
    06780296
  • 负责人:
  • 金额:
    $ 0.51万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では文字認識の高速化・高精度化を目指し、総カテゴリー数が少なく高精度な辞書を作成する手法の考案を目的としている。本研究は主に、文字特徴量の統計的性質の解析、マルチテンプレート化の手法の検討、開発した手法の妥当性の検証の3つの柱から成っていた。以下、それぞれについて研究実績を述べる。1.文字特徴量の統計的性質の解析文字特徴量の分布として、同じ字種の集合内での分布(級内分布)と、字種間の分布、すなわち空間上で各字種の特徴量の重心(あるいは中心)がどのように分布しているか(級間変動)を、多変量統計解析の手法(主成分分析等)を用いて調べた。その結果文字特徴量について、(1)字種内の分布の広がりに対して字種間の分布はかなり密であること、(2)字種内の分布はかなり偏っていること、(3)領域が重なっている字種対は少ないこと、(4)字種ごとに主成分の方向が大きく異なること、等が分かった。2.マルチテンプレート化の手法の検討1.で明らかになった文字特徴量の分布状況を考慮し、マルチテンプレート化の手法を検討した。そして、まず字種ごとの学習パターンから得られた特徴量の集合をそれぞれ一つのカテゴリーとみなし、分割の必要のあるカテゴリーを分割していくことでマルチテンプレートの辞書を作成する手法を考案した。分割が必要かどうかは、文字特徴量の分布形状をもとに誤認識が生じる可能性があるか否かで判断する。ただし、辞書作成には、分割に用いるクラスタリング法が重要な役割を持つことが分かった。より高精度な辞書を作成できるクラスタリング法の検討は今後の課題である。3.手法の妥当性の検証2.で考案した手法の有効性を確かめるため、実際の文字パターンに適用し、辞書作成および認識の実験を行った。その結果、従来法と比較し、総カテゴリー数が同程度の場合本手法で作成した辞書を用いた方が高い認識率を得ることができた。
This study aims at improving the speed and accuracy of character recognition, reducing the number of comprehensive dictionaries, and improving the accuracy of dictionaries. This study focuses on the analysis of the statistical properties of main characters, the discussion of the methods of classification, and the examination of the appropriateness of classification. The following is a summary of the research results. 1. Analysis of statistical properties of character features The distribution of character features within a set of characters (intra-class distribution), the distribution of character features between characters, the center of gravity of character features in a space, and the statistical analysis of multiple characters (principal component analysis, etc.). The result is that the character feature quantity is divided into three parts: (1) the distribution of characters within a word is divided into two parts;(2) the distribution of characters within a word is divided into two parts;(3) the field is divided into two parts;(4) the direction of the main component of a word is divided into two parts. 2. Discussion on the method of transformation of the character 1. Consideration of the distribution of the character feature quantity of the character A study of the method of creating a dictionary by dividing the set of characteristic quantities into two parts The division is necessary, the distribution shape of the character feature is wrong, and the possibility of misunderstanding is judged. The dictionary is composed of two parts, namely, the first part and the second part The problem of how to create a high-precision dictionary 3. 2. Examination of the appropriateness of the method 2. Examination of the validity of the method 3. Verification of the validity of the method 3. Application of the actual text 3. Dictionary creation 4. Implementation of the knowledge 4. The result is that the dictionary is used in the same way as the comparison method, and the recognition rate is high

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

大町 真一郎其他文献

身体技能情報の再構築化による初級者学習支援手法の提案
提出通过重建身体技能信息来为初学者提供学习支持方法
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大谷 昌輝;菅谷 至寛;宮崎 智;大町 真一郎;松浦 慶総
  • 通讯作者:
    松浦 慶総
屋内撮影画像中の案内板までの実距離推定手法の検討
室内拍摄图像导板实际距离估计方法研究
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    竹村 貴文;菅谷 至寛;宮崎 智;大町 真一郎
  • 通讯作者:
    大町 真一郎
"補間処理手法の簡略化による折れ線グラフ画像の高速認識"
《通过简化插值处理方法实现线图图像的高速识别》
On Precise Pattern Recognition by Integrating Recognition Algorithms
集成识别算法的精确模式识别
On the Bias of Predictive Distribution in Pattern Recognition
模式识别中预测分布的偏差
  • DOI:
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    0
  • 作者:
    野田口 玄;大町 真一郎;阿曽 弘具;杉山貴也;Sarunas Raudys;岩村 雅一;安達 則男;Hideaki Goto;根岸 和也;根岸 和也;Takaya Sugiyama;Sarunas Raudys;Masakazu Iwamura
  • 通讯作者:
    Masakazu Iwamura

大町 真一郎的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('大町 真一郎', 18)}}的其他基金

関数のあてはめによる動画像からの物体の抽出と3次元形状の復元
从视频图像中提取对象并通过拟合函数恢复 3D 形状
  • 批准号:
    14780256
  • 财政年份:
    2002
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
文字認識における劣化文字の分析及び高精度認識法に関する研究
字符识别中劣化字符分析及高精度识别方法研究
  • 批准号:
    10780216
  • 财政年份:
    1998
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
高精度文字認識のためのカテゴリー間分布を考慮したクラスタリング手法に関する研究
考虑类别间分布的高精度字符识别聚类方法研究
  • 批准号:
    08780323
  • 财政年份:
    1996
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

中世イロハ引き日本語辞書における見出し掲出システムについての研究
中世纪日语词典标题显示系统研究
  • 批准号:
    24K03931
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
辞書サイト・アプリ開発に資する質の高い日本語例文バンクの構築とその応用研究
构建有助于词典网站/应用程序开发及其应用研究的高质量日语例句库
  • 批准号:
    23K20470
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ケラビット語のオンライン辞書構築
克拉比特语在线词典的构建
  • 批准号:
    24KJ1814
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
辞書式圧縮と圧縮情報処理の深化
字典压缩与压缩信息处理的深化
  • 批准号:
    24K02899
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日本古辞書ポータルサイトの開発による公開研究資源の高度利用
通过开发古代日语词典门户网站,充分利用公共研究资源
  • 批准号:
    24K16080
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
幕末明治期における辞書体資料の受容に関する研究
江户末期和明治时期词典资料的接受研究
  • 批准号:
    24K16088
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
中日バイリンガル(Logographic Bilinguals)の心的辞書における音韻表象の解明
中日双语者心理词汇中语音表征的阐释(语标双语者)
  • 批准号:
    24K06615
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
芸術・文化財情報流通のための多言語辞書データ開発の研究
艺术品文化财产信息发布多语言词典数据开发研究
  • 批准号:
    23K22017
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
医療用語のエンティティリンキングに向けた実践的医療用語辞書の開発
开发用于医学术语实体链接的实用医学术语词典
  • 批准号:
    23K28182
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
専門語彙成長モデルの構築と多言語専門用語辞書拡張への応用
专业词汇增长模型构建及其在多语种专业术语词典扩充中的应用
  • 批准号:
    24H00736
  • 财政年份:
    2024
  • 资助金额:
    $ 0.51万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了