発話内容に依存しない発話速度推定機構により制御される音素タイプライタの研究
不依赖语音内容的语速估计机制控制音素打字机的研究
基本信息
- 批准号:06780226
- 负责人:
- 金额:$ 0.51万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.持続時間からみた認識単位の設定:持続時間を表現するために,単母音と長母音など,音響的な差がほとんどないが持続時間には差があるものを区別するような単位を設定した.2.発話速度を考慮した持続時間モデルの構築:ラベルが付けられていない音声資料からのモデルの学習を考慮し,平均モ-ラ長を基準として,1次関数で音素の持続時間を表現するモデルを構築した。3.発話速度を考慮しないときの音素認識率:発話速度を考慮していない持続時間モデルで制御された非left-right HMMを用いて音素認識実験を行なった.その結果,全く持続時間モデルを用いない場合に比べて,認識率が向上することがわかった.4.発話速度を考慮したときの音素認識率:発話速度を考慮した持続時間モデルで制御された非left-right HMMを用いて音素認識実験を行なった.その結果,(3)の場合に比べて,さらに認識率が向上することがわかった.5.発話速度の推定:ergodic HMMを用いた発話速度の推定を試みたが,困難であることが判明した.持続時間の情報は,重要ではあるが主たる情報ではないため,音素列の情報を無視できなかったことが理由である.そのため,音素列既知の条件で発話速度の推定を行なった.その結果,発話速度のずれの平均が25ms/モ-ラ(音声資料は,180ms/モ-ラ)の精度で推定可能という結果が得られた.6.音素タイプライタの構築:音素列と発話速度を切り離して扱うことが困難であることがわかったので,発話速度を仮定したうえで音素認識を行なうことにより,発話速度推定と音素列抽出を同時に行なう方法を提案し,音素タイプライタのプロトタイプを作成した.動作は確認したが,まだ評価は済んでいない.7.その他:非left-right HMMの構造が,パラメタの学習にとって重要であることがわかった.
1. Hold the time to read the message ID settings: hold the time display to read the phone, the vowel to pronounce the vowel, and the difference between the vowel and the phone. hold the clock, hold the clock, and set the location settings in the different zone. 2. Speech speed test, sound data, audio, sound, sound, data, sound, data, sound, sound, 3. Speech speed test, speech speed test, speech speed test, According to the results of the test, the whole cycle time is used to compare the results, and the performance rate is higher than that of the previous one. 4. Speech speed test speech speech phoneme speech rate: speech speed test speech speed test phoneme recognition rate: speech speed test phoneme recognition rate. The results showed that (3) the results were compared with each other, and the positive rate was higher than that of the control group. 5. Presumption of speech speed: ergodic HMM uses speech speed to deduce that it is not valid and difficult to identify it. It is important to listen to the time, the main customer, the phoneme, the phoneme, the reason, the reason. Since the phonemes are known, the conditions, the speed, the phoneme, the phoneme, the speed, the phoneme, the phoneme, the speed, the The results show that the average accuracy of speech speed measurement is less than 25ms/ precision (180ms/ data), and the accuracy of speech speed measurement may be satisfactory. Phoneme inference, speech speed, phoneme recognition, phoneme speed, phoneme train, phoneme train, phonem The action confirms that you are sorry, and that you do not know what to do. 7. He is not made by left-right HMM. He is very important to learn how to build it.
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
松尾広,石亀昌明: "非left-right HMMの性質に関する検討" 電子通信学会技術報告. SP94-75. 41-48 (1994)
Hiroshi Matsuo,Masaaki Ishigame:“非左右 HMM 的性质研究”IEICE 技术报告 41-48 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
松尾広,石亀昌明: "非left-right HMMの性質に関する検討" 情報処理学会研究報告. 94-SLP-4. 97-104 (1994)
Hiroshi Matsuo,Masaaki Ishigame:“非左右 HMM 的特性研究”日本信息处理学会研究报告 94-SLP-4 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
松尾 広其他文献
松尾 広的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
Research and Production of a Manual on English Phoneme Recognition for International Students
留学生英语音素识别手册的研究与制作
- 批准号:
23K12201 - 财政年份:2023
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Neural encoding of phoneme and vocal intensity interactions in the motor cortex and basal ganglia
运动皮层和基底神经节中音素和声音强度相互作用的神经编码
- 批准号:
10268199 - 财政年份:2020
- 资助金额:
$ 0.51万 - 项目类别:
Study on English phoneme formation and English word writing in Children who use sign language
手语儿童英语音素形成和英语单词书写研究
- 批准号:
20K03021 - 财政年份:2020
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Neural encoding of phoneme and vocal intensity interactions in the motor cortex and basal ganglia
运动皮层和基底神经节中音素和声音强度相互作用的神经编码
- 批准号:
10447486 - 财政年份:2020
- 资助金额:
$ 0.51万 - 项目类别:
How do (or don’t) we learn letters-sound associations? Neurocognitive processes underlying the learning of Grapheme-Phoneme-Correspondences
我们如何(或不)学习字母-声音关联?
- 批准号:
405007295 - 财政年份:2018
- 资助金额:
$ 0.51万 - 项目类别:
Research Grants
EAGER: Exploring the Feasibility of Phoneme Sound Origins to Enhance Mobile Authentication
EAGER:探索音素声音起源增强移动认证的可行性
- 批准号:
1835963 - 财政年份:2018
- 资助金额:
$ 0.51万 - 项目类别:
Standard Grant
Elucidation of cerebral cortical network dynamics involved in perceptual formation of phoneme repair
阐明参与音素修复知觉形成的大脑皮层网络动力学
- 批准号:
17K04512 - 财政年份:2017
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Doctoral Dissertation Research: The acquisition of phoneme categories
博士论文研究:音素类别的获取
- 批准号:
1451792 - 财政年份:2015
- 资助金额:
$ 0.51万 - 项目类别:
Standard Grant
Are phonemes perceptually real?: An examination of the parallel phoneme-syllable processing model
音素在感知上是真实的吗?:并行音素音节处理模型的检验
- 批准号:
15K02493 - 财政年份:2015
- 资助金额:
$ 0.51万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Reading and the Automaticity of Grapheme-to-Phoneme-to-Lexical/Semantic Activation
阅读和字素到音素到词汇/语义激活的自动性
- 批准号:
467079-2014 - 财政年份:2014
- 资助金额:
$ 0.51万 - 项目类别:
University Undergraduate Student Research Awards