状態と出力に相互依存関係を有する確率モデルの構造最適化と頑健性強化に関する研究

状态与输出相互依赖的随机模型结构优化及鲁棒性增强研究

基本信息

  • 批准号:
    17700208
  • 负责人:
  • 金额:
    $ 1.6万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2005
  • 资助国家:
    日本
  • 起止时间:
    2005 至 2006
  • 项目状态:
    已结题

项目摘要

本年度は,以下の2点について検討を行った.(1)部分隠れマルコフモデル(PHMM)のモデル構造最適選択PHMMのモデル構造を音韻毎に最適化する枠組みとして,昨年度は,評価基準として重み付き尤度比最大化基準を,最適化アルゴリズムとして遺伝的アルゴリズムを導入し,講演音声認識において従来法の誤りを削減した.本年度は,下記A)〜C)について詳細な検討を行った.A)評価関数:重み付き尤度比基準,最尤基準,ベイズ基準など複数の評価基準を導入し認識性能を評価したところ,識別的な基準である尤度比基準が最良の性能を与えることがわかった.B)最適化アルゴリズム:遺伝的アルゴリズムとタブサーチを用いたときの性能を評価したところ,タブサーチは局所解に陥りやすく,遺伝的アルゴリズムの方が高速に最適解に到達することがわかった.C)識別クラスの共有:探索の効率化のため音韻のクラスタリングを行ったが,最適化の段階でクラスを共有してしまうと,共有しない場合と同程度の性能を得られないことがわかった.(2)環境の変動に頑健な特徴量の検討PHMMのように高精度な確率モデルは,HMMなどの単純なモデルと比較して発話者や環境の変動の影響を受け易い.したがって,音響特徴量から発話者の情報や環境の情報を取り除き,識別に必要な情報である音韻情報のみを抽出する手法(識別情報抽出)について検討を行った.識別情報抽出として,HLDAやそれを拡張したManifold HLDA(MHLDA)を提案し,単語音声認識により評価を行ったところ,HLDAとMHLDAにより抽出されたパラメータを統合することで,環境の変動に対して頑健な性能を与えることがわかった.この知見を発展させ,HLDAにブースティングを導入した確率モデルの統合手法についても検討を行い,最尤識別に比べ頑健性の高い認識が可能になるという予備的な知見も得た.
は this year, the following の 2 に つ い て 検 line for を っ た. (1) the government れ マ ル コ フ モ デ ル (PHMM) の モ デ ル structure optimum sentaku PHMM の モ デ ル tectonic を rhyme in their optimal に す る 枠 group み と し て, annual は yesterday, benchmark review 価 と し て heavy み pay than to maximize the benchmark を き especially degree, optimization ア ル ゴ リ ズ ム と し て heritage 伝 ア Youdaoplaceholder0 to introduce ゴリズムを, to recognize the sound of the speech にお て従 て従 to reduce the error of the French <s:1> and cut the <s:1> た. は this year, under A) ~ C) に つ い て detailed な 検 line for を っ た. A) A review of the 価 masato: heavy み pay き degrees than the benchmark, the benchmark, ベ イ ズ benchmark な ど plural の evaluation benchmark 価 を import し know を performance review 価 し た と こ ろ, identify な benchmark で あ る most good degrees than the benchmark が の performance を and え る こ と が わ か っ た. B) optimization ア ル ゴ リ ズ ム : but 伝 ア ル ゴ リ ズ ム と タ ブ サ ー チ を with い た と き の を performance evaluation 価 し た と こ ろ, タ ブ サ ー チ は bureau solution に 陥 り や す く, but 伝 ア ル ゴ リ ズ ム の party が high-speed に に reach optimum solution す る こ と が わ か っ た. C) to identify ク ラ ス の Shared: explore の sharper rate change の た め phonological の ク ラ ス タ リ ン グ を line っ た が, most Optimization の Duan Jie で ク ラ ス を mutual し て し ま う と, a total of し な い occasions と の を performance to the same extent ら れ な い こ と が わ か っ た. (2) environmental の - move に robust な, の 徴 quantity beg PHMM 検 の よ う に high-precision な probabilistic モ デ ル は, HMM な ど の 単 pure な モ デ ル と compare し て 発 の や environment the speaker's words - the influencing を け easy い. の し た が っ て, stereo 徴 quantity か ら 発 words の や environment の intelligence を り except き, identify に な necessary information で あ る phonological intelligence の み を spare す る technique (identification information extraction) に つ い て 検 line for を っ た. Identify the intelligence extract と て て,HLDAやそれを拡, zhang たManifold HLDA MHLDA を proposal し, 単 voice sound understanding に よ り review 価 を line っ た と こ ろ, HLDA と MHLDA に よ り spare さ れ た パ ラ メ ー タ を integration す る こ と で, environmental の - move に し seaborne て robust な performance を and え る こ と が わ か っ た. こ の knowledge を 発 exhibition さ せ, HLDA に ブ ー ス テ ィ ン グ を import し た Probabilistic モ デ ル の integration technique に つ い て も 検 for line を い, most especially to identify に than べ cognition の high い robust が may に な る と い う reserve な know see も た.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ロボット頭部に設置した4系統指向性マイクロホンによる音源定位におけるHLDA利用の効果
使用安装在机器人头部的四个定向麦克风使用 HLDA 进行声源定位的效果
ロボット頭部に設置したマイクロホンによる環境変動に頑健な音源定位
使用安装在机器人头部的麦克风针对环境变化进行稳健的声源定位
重み付きHLDAを用いた相補的識別器の構成
使用加权 HLDA 构建互补分类器
Optimizing the Structure of Partly-Hidden Markov Models Using Weighted Likelihood-Ratio Maximization Criterion
使用加权似然比最大化准则优化部分隐马尔可夫模型的结构
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tetsuji Ogawa;Tetsunori Kobayashi
  • 通讯作者:
    Tetsunori Kobayashi
Manifold HLDA and Its Application to Robust Speech Recognition
流形HLDA及其在鲁棒语音识别中的应用
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Toshiaki Kubo;Tetsuji Ogawa;Tetsunori Kobayashi
  • 通讯作者:
    Tetsunori Kobayashi
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

小川 哲司其他文献

Calving Sign Detection of Breeding Cows Based on Video Monitoring - How to Construct and Operate a Video Monitoring System that Enables Users to Make Decisions with Conviction?
基于视频监控的种牛产犊征兆检测——如何构建和运营让用户有信心决策的视频监控系统?
  • DOI:
    10.11499/sicejl.61.746
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Terao Hayato;Noguchi Wataru;Iizuka Hiroyuki;Yamamoto Masahito;小山大嘉,青山一真,鳴海拓志,葛岡英明,雨宮智浩;小川 哲司
  • 通讯作者:
    小川 哲司
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲
  • 通讯作者:
    中村 哲
敵対的デノイジングオートエンコーダによる非線形ひずみ除去フィルタリング
使用对抗性去噪自动编码器进行非线性去失真滤波
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    俵 直弘 ;小林 哲則 ;藤枝 大 ;片桐 一浩 ;矢頭 隆 ;小川 哲司
  • 通讯作者:
    小川 哲司
雑音下音声認識評価ワーキンググループ活動報告:認識に影響する要因の個別評価環境(2)
噪声中语音识别评估工作组活动报告:影响识别因素的个体评估环境(2)
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    北岡 教英;山田 武志;滝口 哲也;柘植 覚;山本 一公、宮島 千代美;西浦 敬信;中山 雅人;傳田 遊亀;藤本 雅清 田村 哲嗣;松田 繁樹;小川 哲司;黒岩 眞吾;武田 一哉;中村 哲
  • 通讯作者:
    中村 哲
部分隠れマルコフモデルによる連続音声認識
使用部分隐马尔可夫模型的连续语音识别

小川 哲司的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('小川 哲司', 18)}}的其他基金

意思決定支援のための持続可能な状態監視システムの構築・運用法に関する研究
可持续状态监测系统建设与运行支持决策研究
  • 批准号:
    23K24892
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Research on sustainable fishery condition monitoring through cooperation between fishermen and artificial intelligence technology
渔民与人工智能技术合作可持续渔业状况监测研究
  • 批准号:
    22K19218
  • 财政年份:
    2022
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Study on Construction and Operation Method of Sustainable Condition Monitoring System for Decision Support
可持续状态监测决策支持系统构建及运行方法研究
  • 批准号:
    22H03636
  • 财政年份:
    2022
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)

相似海外基金

グローバルコミュニケーションに資する大脳皮質の音声情報処理機能単位の解明
阐明有助于全球交流的大脑皮层声音信息处理功能单元
  • 批准号:
    24K15685
  • 财政年份:
    2024
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
蝸牛神経核における音声情報処理機構の解明
阐明耳蜗核中的语音信息处理机制
  • 批准号:
    25462628
  • 财政年份:
    2013
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
音声の絶対的特徴と相対的特徴を融合した頑健で柔軟な音声情報処理技術の構築
构建鲁棒灵活的语音信息处理技术,结合语音的绝对特征和相对特征
  • 批准号:
    11J08960
  • 财政年份:
    2011
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
乳児の音声情報処理の発達と言語獲得:事象関連電位による研究
婴儿语音信息处理和语言习得的发展:使用事件相关电位的研究
  • 批准号:
    07J01902
  • 财政年份:
    2007
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声情報処理技術を活用したマルチモーダルボイストレーニング支援システム
利用语音信息处理技术的多模态语音训练支持系统
  • 批准号:
    16700172
  • 财政年份:
    2004
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
  • 批准号:
    16016219
  • 财政年份:
    2004
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
  • 批准号:
    15017225
  • 财政年份:
    2003
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
音声情報処理技術を応用した弁別素性の音響及び聴覚的側面に関する基礎的研究
应用语音信息处理技术的判别特征声学和听觉方面的基础研究
  • 批准号:
    14651094
  • 财政年份:
    2002
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
障害幼児の音声情報処理と動作表現との関連性の解明
阐明残疾儿童言语信息处理与动作表达之间的关系
  • 批准号:
    07710215
  • 财政年份:
    1995
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
障害幼児の音声情報処理と言語発達過程の解明
阐明残疾儿童的言语信息处理和语言发展过程
  • 批准号:
    06710183
  • 财政年份:
    1994
  • 资助金额:
    $ 1.6万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了