ベイズ基準に基づく幾何学的変動に頑健な画像認識モデルの構築

基于贝叶斯准则构建对几何变化具有鲁棒性的图像识别模型

基本信息

  • 批准号:
    15J08391
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2015
  • 资助国家:
    日本
  • 起止时间:
    2015-04-24 至 2017-03-31
  • 项目状态:
    已结题

项目摘要

従来の統計モデルに基づく画像認識手法の多くは,モデルの学習のみに注目して研究されてきた.しかし,画像認識用の統計モデルを学習するためには,画像の切り出し,各種正規化,特徴抽出などの事前処理が必要となる.これらの事前処理は,認識対象に強く依存するため,人手による画像の切り出しやヒューリスティックな正規化処理が用いられてきたが,認識対象ごとにヒューリスティックな方法で事前処理を設計することは高いコストを必要とする.本研究では,認識対象の位置や大きさの正規化をモデル化することができる分離型格子隠れマルコフモデル (SL-HMM) や,SL-HMMと因子分析を統合した可変固有画像モデル (HMEM) に注目して,幾何学的変動に頑健なモデルの高精度化を行う.これらのモデルは従来では煩雑であった事前処理とモデルの学習を同時に最適化することができるため,認識対象ごとに事前処理を設計する必要がなく汎用性が高い手法である.本年度は,ベイズ基準の近似計算を行う変分ベイズ法に確定的アニーリングEMアルゴリズムを適用し,HMEMの学習を行った.顔画像認識や手書き数字認識実験により,提案した学習アルゴリズムは,学習データが少量の場合であっても精度の高いHMEMを学習できることを示した. さらに,近年注目を集めているディープラーニングに基づく手法である畳み込みニューラルネットワーク (CNN) と提案法の比較実験を行った.比較実験より,学習データが少量の条件や,認識対象に位置や大きさの変動が多く含まれる条件においては,提案法はCNNより高い認識性能を示すことが確認できた.
已经研究了许多基于传统统计模型的图像识别方法,重点是模型学习。但是,为了学习图像识别的统计模型,需要进行预处理,例如切割,各种归一化和特征提取。这些预处理高度依赖于识别的目标,并且已经使用了手动图像提取和启发式归一化处理,但是以启发式方式设计预处理的每个识别目标都需要高成本。在这项研究中,我们专注于可分离的晶格隐藏的马尔可夫模型(SL-HMM),该模型可以模拟识别对象的位置和大小的归一化,以及可变特异性的图像模型(HMEM)(HMEM),该模型(HMEM)集成了SL-HMM和因子分析,以提高模型的准确性,这些模型的准确性可鲁棒到几何变化。这些模型可以同时优化以前复杂的预处理和模型学习,因此无需针对每个识别对象设计预处理,从而使它们具有很高的用途。今年,我们将确定性退火算法应用于变分贝叶斯方法,该方法对贝叶斯标准进行了近似计算并研究了HMEM。通过面部图像识别和手写数字识别实验,我们已经表明,即使有少量的培训数据,提出的学习算法也可以学习高度准确的HMEM。此外,我们与卷积神经网络(CNN)进行了对拟议方法的比较实验,这是一种基于深度学习的方法,近年来引起了人们的注意。比较实验证实,在训练数据较小或识别目标包含位置和大小的许多变化的情况下,所提出的方法比CNN表现出比CNN更高的识别性能。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
統計的パラメトリック音声合成のためのオーディオブックを用いた学習コーパス自動構築
使用有声读物自动构建学习语料库进行统计参数语音合成
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    沢田慶;伊神和輝;浅井千明;佐藤雄介;橋本佳;大浦圭一郎;南角吉彦;徳田恵一
  • 通讯作者:
    徳田恵一
画像認識のための混合出力分布を用いた分離型格子HMMにおけるパラメータ共有構造の検討
图像识别中使用混合输出分布的可分离格HMM参数共享结构研究
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    酒井和幸;熊谷大慧;阿部五月;渡邉洋輔;山田直也;古川英光;藤本拓;南絵里菜;光上義朗;足立芳史;助川 正人,沢田 慶,橋本 佳,南角 吉彦,徳田 恵一
  • 通讯作者:
    助川 正人,沢田 慶,橋本 佳,南角 吉彦,徳田 恵一
発音情報が未知の言語におけるテキスト音声合成システム構築法の検討
发音信息未知语言的文语音合成系统构建方法研究
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    沢田慶;橋本佳;大浦圭一郎;南角吉彦;徳田 恵一
  • 通讯作者:
    徳田 恵一
The NITech text-to-speech system for the Blizzard Challenge 2016
用于 2016 年暴雪挑战赛的 NITech 文本转语音系统
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kei Sawada;Chiaki Asai;Kei Hashimoto;Keiichiro Oura;and Keiichi Tokuda
  • 通讯作者:
    and Keiichi Tokuda
分離型格子HMMによる特徴量生成を用いた識別モデルに基づく画像認識
基于使用可分离格HMM特征生成的判别模型的图像识别
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    K. Ahmed;Y. Watanabe;T. Higashihara;H. Arafune;T. Kamijo;T. Morinaga;T. Sato;M. Makino;M. Kawakami;and H. Furukawa;都築 良成,沢田 慶,橋本 佳,南角 吉彦,徳田 恵一
  • 通讯作者:
    都築 良成,沢田 慶,橋本 佳,南角 吉彦,徳田 恵一
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

沢田 慶其他文献

沢田 慶的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

Adaptive Probabilistic Robotics through Statistical Motion Analysis and Kinematics
通过统计运动分析和运动学的自适应概率机器人
  • 批准号:
    18H03295
  • 财政年份:
    2018
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of stochastic models to represent cellular states and their application to analysis of nuclear division dynamics
代表细胞状态的随机模型的开发及其在核分裂动力学分析中的应用
  • 批准号:
    16K00414
  • 财政年份:
    2016
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Statistical access control based on a state-space model
基于状态空间模型的统计访问控制
  • 批准号:
    15K00195
  • 财政年份:
    2015
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Merged-Output Hidden Markov Model and Its Applications in Music Information Processing
合并输出隐马尔可夫模型及其在音乐信息处理中的应用
  • 批准号:
    25880029
  • 财政年份:
    2013
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Research Activity Start-up
Modelling vertical migration patterns of wild animals
模拟野生动物的垂直迁徙模式
  • 批准号:
    24654031
  • 财政年份:
    2012
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了