モーラ遷移確率モデルによる韻律の表現と音声認識への利用に関する研究

基于mora转移概率模型的韵律表达及其在语音识别中的应用研究

基本信息

  • 批准号:
    11878058
  • 负责人:
  • 金额:
    $ 1.28万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Exploratory Research
  • 财政年份:
    1999
  • 资助国家:
    日本
  • 起止时间:
    1999 至 2000
  • 项目状态:
    已结题

项目摘要

基本周波数パターンを中心とする韻律的特徴をモーラ単位で表現し、その遷移確率モデルにより韻律に関する事項を表現して検出、識別を行い、その結果を音声認識に利用することを目的とし、以下の様に所期の目標を達成した。1.離散型HMMであるモーラ遷移確率モデルを連続分布モデルとすることの検討を行った。基本周波数パターンをスプライン補間した後、2次曲線で近似し、その係数をパラメータとすることで数%の境界検出率の向上を得た。2.休止が後続する場合、モーラ持続時間が閾値より大きい場合について個別にモデル化することにより、アクセント句境界検出率の数%程度の向上を得た。3.入力された連続音声を、まず音素HMMと文章単位のモーラbi-gramで認識し、得られたモーラ境界情報を利用して、モーラ遷移確率モデルによりアクセント句境界を検出する。次に、検出された境界情報を基に、アクセント句単位のモーラbi-gramを用いて再認識を行うことにより認識率の向上を達成する。この様な2段構成の認識アルゴリズムを構築して、ATR連続音声データベースを用いた認識実験で数%のモーラ認識率の向上を確認した。4.上記の前段認識とアクセント句境界検出において、2ベストを取って認識を進め、最終的なスコアによって確定することを行い、1ポイント程度のモーラ認識率の向上を達成した。さらに、後段の2ndベストを時間情報を考慮して利用することで認識率がさらに向上する可能性を示した。5.発話内容既知の場合について、開発した手法による韻律の自動ラベリングを行い、7割程度の精度でのラベリングが可能なことを示した。6.モーラ遷移確率モデルを結合することにより、アクセント型、フレーズ境界位置を入力としてアクセント句の基本周波数パターンを生成することを行った。モーラ境界での不連続を平滑化するこれにより、音声合成に利用可能なことを示した。
Basic cycle for パ タ ー ン を center と す る rhythm of 徴 を モ ー ラ 単 し で performance, そ の migration of probabilistic モ デ ル に よ り rhythm に masato す る matters を performance し て 検 line, identify を い, そ の results を sounds know に using す る こ と を purpose と し, the following の others に period by の target を reached し た. 1. The discrete HMM で あ る モ ー ラ migration of probabilistic モ デ ル を even 続 distribution モ デ ル と す る こ と の 検 line for を っ た. Basic cycle for パ タ ー ン を ス プ ラ イ ン curation し た curve, 2 times after で approximate し, そ の coefficient を パ ラ メ ー タ と す る こ と で number % の realm 検 out rate の upward を た. 2. Rest after が 続 す る occasions, モ ー ラ が 続 time threshold numerical よ り big き い occasions に つ い て individual に モ デ ル change す る こ と に よ り, ア ク セ ン ト sentence boundary の 検 rate for % level た の を upward. (3) into force さ れ た even 続 sounds を, ま ず phoneme HMM と article 単 a の モ ー ラ bi - "gramm で knoweth し, ら れ た モ ー ラ state intelligence を using し て, モ ー ラ migration of probabilistic モ デ ル に よ り ア ク セ ン ト sentence boundary を 検 out す る. Time に, 検 さ れ た state intelligence を に, ア ク セ ン ト sentence 単 a の モ ー ラ bi - "gramm を with い て line between を う こ と に よ り know rate の を reach upward す る. こ の others in understanding の な 2 paragraph composition ア ル ゴ リ ズ ム を build し て, ATR 続 sounds デ ー タ ベ ー ス を with い た know be 験 で number % の モ ー ラ の know rate upward を confirm し た. 4. Written front know の と ア ク セ ン ト sentence boundary 検 out に お い て, 2 ベ ス ト を take っ て know を into め, final な ス コ ア に よ っ て determine す る こ と を い, 1 ポ イ ン ト degree の モ ー ラ know rate の を reached up し た. さ ら に, after a period of 2 nd の ベ ス ト を time intelligence を consider し て using す る こ と で know rate が さ ら に upward す を る possibility in し た. 5. 発 words content already know の occasions に つ い て, open 発 し た gimmick に よ る rhythm の automatic ラ ベ リ ン グ を い, 7 degree の cutting precision で の ラ ベ リ ン グ が may な こ と を shown し た. 6. モ ー ラ migration of probabilistic モ デ ル を combining す る こ と に よ り, ア ク セ ン ト type, フ レ ー ズ boundary location を と into force し て ア ク セ ン ト basic cycle for other の パ タ ー ン を generated す る こ と を line っ た. モ ー ラ realm で の is not even 続 を smoothing す る こ れ に よ り, voice synthesis に may use な こ と を shown し た.

项目成果

期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
岩野公司: "Prosodic word boundary detection using mora transition modeling of fundamental frequency contours --Speaker independent experiments--"Proc. European Conf. on Speech Communication and Technology. (1999)
Iwano, Ltd.:“使用基频轮廓的音节转换模型进行韵律词边界检测——与说话人无关的实验——”欧洲语音通信与技术会议(1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
広瀬啓吉: "Statistical modeling of prosodic features and its use for speech recognition"Proc. International Conf. on Speech Processing. 1. 43-52 (1999)
Keikichi Hirose:“韵律特征的统计建模及其在语音识别中的应用”Proc。 1. 43-52 (1999)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
岩野公司: "Speaker-Independent detection of prosodic word boundary using mora transition modeling of fundamental frequency contours"Proc. Japan-China Symposium on Advanced Information Technology. 107-114 (1999)
Iwano, Ltd.:“使用基频轮廓的音节转换模型进行与说话人无关的韵律词边界检测”Proc. 中日先进信息技术研讨会 107-114 (1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
岩野公司: "モーラを単位とした基本周波数パターンの確率モデル化とそれによるアクセント句境界の検出"情報処理学会論文誌. 40・4. 1356-1364 (1999)
Koji Iwano:“使用 Mora 作为单位的基频模式的概率建模以及使用它的重音短语边界检测”日本信息处理学会汇刊 40・4(1999 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
岩野公司: "語彙制約なし音声認識へのアクセント句境界検出の統合"電子情報通信学会論文誌. J83-D-II・10. 1977-1985 (2000)
Koji Iwano:“将重音短语边界检测集成到没有词汇限制的语音识别中”,电子、信息和通信工程师学会汇刊 J83-D-II·1977-1985(2000 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

広瀬 啓吉其他文献

生成過程モデルに基づく母語話者と中国語話者の日本語朗読音声の基本周波数パターン
基于生成过程模型的母语者和汉语者日语阅读语音的基本频率模式
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平野 宏子;広瀬 啓吉;河合 剛;顧文 涛;峯松 信明
  • 通讯作者:
    峯松 信明
音調核モデルに基づく中国語F_0パターンの2段階生成
基于声调核模型的汉语F_0模式的两步生成
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀;孫慶華
  • 通讯作者:
    孫慶華
基本周波数パターン生成過程モデルのコーパスベースパラメータ自動抽出の評価
基于语料库的基频模式生成过程模型自动参数提取评价
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史;河村 美由紀
  • 通讯作者:
    河村 美由紀
種々の調子の音声合成のための韻律制御-感情音声合成の視点から-(招待講演)
各种声调语音合成的韵律控制——从情感语音合成的角度——(特邀报告)
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉
  • 通讯作者:
    広瀬 啓吉
文節単位での感情の程度を考慮した統計的韻律制御
考虑每个短语的情感程度的统计韵律控制
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Keikichi Hirose;Yasufumi Asano;Nobuaki Minematsu;Jinfu Ni;Wentao Gu;Keikichi Hirose;Qinghua Sun;Keikichi Hirose;越智景子;Keikichi Hirose;Jinfu Ni;Quinghua Sun;広瀬 啓吉;浅野 泰史
  • 通讯作者:
    浅野 泰史

広瀬 啓吉的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('広瀬 啓吉', 18)}}的其他基金

認知モデルと常識ベースに基づく情動を含む音声コミュニケーション
语音通信,包括基于认知模型和常识的情感
  • 批准号:
    08F08049
  • 财政年份:
    2008
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
劣条件下の混合音響信号の分離とその音声認識への利用
恶劣条件下混合声信号的分离及其在语音识别中的应用
  • 批准号:
    06F06099
  • 财政年份:
    2006
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    06F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
フィンランド人日本語学習者による日本語語い音調の韻律研究
芬兰日语学习者对日语声调的韵律研究
  • 批准号:
    05F05756
  • 财政年份:
    2005
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
文節境界を考慮した統計的言語モデルの高度化と音声認識への利用
推进考虑子句边界及其在语音识别中的使用的统计语言模型
  • 批准号:
    16650034
  • 财政年份:
    2004
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
中国語基本周波数パターンの分析、定式化と合成手法の開発
中国基频模式分析、合成方法的制定和发展
  • 批准号:
    04F04035
  • 财政年份:
    2004
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
高品質音声合成のための韻律制御
高质量语音合成的韵律控制
  • 批准号:
    12132202
  • 财政年份:
    2000
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化
以韵律为中心的口语信息处理的复杂性
  • 批准号:
    12132101
  • 财政年份:
    2000
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
韻律に着目した音声言語情報処理の高度化に関する調査研究
以韵律为中心的口语信息处理进展研究
  • 批准号:
    10898014
  • 财政年份:
    1998
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
モデルの広がりを考慮した頑健な音声認識手法の研究
考虑模型扩散的鲁棒语音识别方法研究
  • 批准号:
    09878065
  • 财政年份:
    1997
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Exploratory Research

相似海外基金

「聞き手に働きかける要素」の韻律的特徴とその習得をめぐって
论“影响听者的元素”的韵律特征及其习得
  • 批准号:
    23K00639
  • 财政年份:
    2023
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
音声による感情表出に関する韻律的特徴の分析と韻律制御モデルの構築
言语情感表达相关韵律特征分析及韵律控制模型构建
  • 批准号:
    07J00642
  • 财政年份:
    2007
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
日本語感情音声の韻律的特徴分析:韓国人日本語学習者と日本語母語話者の比較を通して
日语情感言语的韵律特征分析:通过韩国日语学习者与日语母语者的比较
  • 批准号:
    07J01163
  • 财政年份:
    2007
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ドイツ語の心態詞と韻律的特徴との関わり
德语态度词与韵律特征的关系
  • 批准号:
    15720098
  • 财政年份:
    2003
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
韻律的特徴の持つ談話構造に関する情報伝達能力の解明
韵律特征所具有的语篇结构信息传递能力的阐释
  • 批准号:
    13710318
  • 财政年份:
    2001
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
音声コミュニケーション能力測定を目的とした音声の韻律的特徴の認知に関する基礎研究
以语音交流能力测量为目的的语音韵律特征识别基础研究
  • 批准号:
    12710087
  • 财政年份:
    2000
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
音声における韻律的特徴の聴取能力測定を目的としたテスト開発のための基礎研究
开发旨在测量语音韵律特征听力能力的测试的基础研究
  • 批准号:
    10710073
  • 财政年份:
    1998
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
日本語東京方言と中国語上海方言の音響特性にみる韻律的特徴の対照研究
日语东京话与汉语上海话声学特征韵律特征的比较研究
  • 批准号:
    05858040
  • 财政年份:
    1993
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
日本語音声の韻律的特徴と言語的・パラ言語的情報に関する定量的研究
日语语音韵律特征及语言/副语言信息的定量研究
  • 批准号:
    04207112
  • 财政年份:
    1992
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
日本語音声の韻律的特徴の生理学的機制及び語韻の音響的特徴との相互関係の研究
日语语音韵律特征的生理机制及其与韵律声学特征的相关性研究
  • 批准号:
    04207105
  • 财政年份:
    1992
  • 资助金额:
    $ 1.28万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了