発話内容に依存しない発話速度推定機構により制御される音素タイプライタの研究

不依赖语音内容的语速估计机制控制音素打字机的研究

基本信息

  • 批准号:
    06780226
  • 负责人:
  • 金额:
    $ 0.51万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1994
  • 资助国家:
    日本
  • 起止时间:
    1994 至 无数据
  • 项目状态:
    已结题

项目摘要

1.持続時間からみた認識単位の設定:持続時間を表現するために,単母音と長母音など,音響的な差がほとんどないが持続時間には差があるものを区別するような単位を設定した.2.発話速度を考慮した持続時間モデルの構築:ラベルが付けられていない音声資料からのモデルの学習を考慮し,平均モ-ラ長を基準として,1次関数で音素の持続時間を表現するモデルを構築した。3.発話速度を考慮しないときの音素認識率:発話速度を考慮していない持続時間モデルで制御された非left-right HMMを用いて音素認識実験を行なった.その結果,全く持続時間モデルを用いない場合に比べて,認識率が向上することがわかった.4.発話速度を考慮したときの音素認識率:発話速度を考慮した持続時間モデルで制御された非left-right HMMを用いて音素認識実験を行なった.その結果,(3)の場合に比べて,さらに認識率が向上することがわかった.5.発話速度の推定:ergodic HMMを用いた発話速度の推定を試みたが,困難であることが判明した.持続時間の情報は,重要ではあるが主たる情報ではないため,音素列の情報を無視できなかったことが理由である.そのため,音素列既知の条件で発話速度の推定を行なった.その結果,発話速度のずれの平均が25ms/モ-ラ(音声資料は,180ms/モ-ラ)の精度で推定可能という結果が得られた.6.音素タイプライタの構築:音素列と発話速度を切り離して扱うことが困難であることがわかったので,発話速度を仮定したうえで音素認識を行なうことにより,発話速度推定と音素列抽出を同時に行なう方法を提案し,音素タイプライタのプロトタイプを作成した.動作は確認したが,まだ評価は済んでいない.7.その他:非left-right HMMの構造が,パラメタの学習にとって重要であることがわかった.
1. Understanding the setting of the unit: When the holding time is expressed, the single vowel and the long vowel are equal, and the sound difference is equal to the difference, so the unit can be set. 2. Construction of the holding time model taking into account the transmission speed: Taking into account the learning of the sound data, the average duration is used as a benchmark, and the holding time model for 1 level is constructed. 3. The transmission speed is taken into account, and the phoneme recognition rate is taken into account. The transmission speed is taken into account, and the duration time is controlled. The non-left-right HMM is used. 4. Speech speed is considered. Phoneme recognition rate: Speech speed is considered. Duration is considered. Phoneme recognition rate is considered. 5. Estimation of speech speed:ergodic HMM estimation of speech speed is difficult to determine. Hold the time information, important The condition of phoneme sequence is known and the speed of speech is estimated. 6. Construction of phoneme string: phoneme string transmission speed: separation of phoneme string transmission speed: difficulty of phoneme string transmission speed: determination of phoneme string recognition: simultaneous phoneme string extraction: method of phoneme string transmission speed estimation: simultaneous phoneme string extraction: method of phoneme string transmission speed estimation: phoneme string extraction: method of phoneme string extraction. The action is confirmed, and the comment is made. 7. He is not left-right HMM structure, and the learning is important.

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松尾広,石亀昌明: "非left-right HMMの性質に関する検討" 電子通信学会技術報告. SP94-75. 41-48 (1994)
Hiroshi Matsuo,Masaaki Ishigame:“非左右 HMM 的性质研究”IEICE 技术报告 41-48 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
松尾広,石亀昌明: "非left-right HMMの性質に関する検討" 情報処理学会研究報告. 94-SLP-4. 97-104 (1994)
Hiroshi Matsuo,Masaaki Ishigame:“非左右 HMM 的特性研究”日本信息处理学会研究报告 94-SLP-4 (1994)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

松尾 広其他文献

松尾 広的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了