混合仮説検証型並列音素ラベリング(PPL)方式による話者独立音声認識システム
使用混合假设检验并行音素标记(PPL)方法的与说话人无关的语音识别系统
基本信息
- 批准号:07455157
- 负责人:
- 金额:$ 4.03万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for General Scientific Research (B)
- 财政年份:1995
- 资助国家:日本
- 起止时间:1995 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
混合仮説検証型並列音素ラベリング方式に基づく単語音声認識システムによる認識・実験を通して、話者独立システムの認識率向上と大語彙化に対する問題点を明らかにし、その解決を試みた。(1)これまでに得られている並列音素ラベリング方式による単語音声認識システムで、辞書の単語数を1845語にして、さまざまなタイプの話者独立型のシステムの性能評価を行った。従来のタイプの話者独立型システムのエラーレートは20.7%であったが、本研究で提案のシステムのエラーレートは16.2%であり、PPL方式の有効性が確かめられた。(2)提案のPPL方式のシステムのエラーレートは、2000語程度で16%程度で一応満足できる性能であったが、エラーレートが必ずしも十分低くないので、エラーの解析を行っている。セグメンテーションとラベリングのエラーが主な原因であることは明らかであるので、それらのシステムの性能改善を試みている。(3)音素リファレンスセットの構成法として、声質の似た話者の基本セットは混合し、似ていない話者の基本セットは混合しないで並列に使用する形の構成法によるシステムが最も認識率が高いことを確かめた。
Mixed 仮 said 検 card type and phoneme ラ ベ リ ン グ way に base づ く 単 voice sound understanding シ ス テ ム に よ る know, be 験 を tong し て, words independent シ ス テ ム の と up large vocabulary understanding rate change に す seaborne る problem point を Ming ら か に し, そ の try solve を み た. (1) こ れ ま で に have ら れ て い る tied for phoneme ラ ベ リ ン グ way に よ る 単 voice sound understanding シ ス テ ム で, dictionaries の 単 language number を 1845 language に し て, さ ま ざ ま な タ イ プ の words independent model の シ ス テ ム の performance evaluation 価 を line っ た. 従 to の タ イ プ の words independent model シ ス テ ム の エ ラ ー レ ー ト は 20.7% で あ っ た が, this study proposed で の シ ス テ ム の エ ラ ー レ ー ト は 16.2% で あ り, PPL way の have sharper が か indeed め ら れ た. (2) proposal の way PPL の シ ス テ ム の エ ラ ー レ ー ト は, 2000 degree で 16% degree で a 応 against foot で き る performance で あ っ た が, エ ラ ー レ ー ト が will ず し も very low く な い の で, エ ラ ー の parsing line を っ て い る. セ グ メ ン テ ー シ ョ ン と ラ ベ リ ン グ の エ ラ ー が main な reason で あ る こ と は Ming ら か で あ る の で, そ れ ら の シ ス テ ム の performance improvement を try み て い る. (3) the phonemes リ フ ァ レ ン ス セ ッ ト の composition method と し て, sound quality の た words の basic セ ッ ト は mixed し, like て い な い words の basic セ ッ ト は mixed し な い で parallel に use す る form の composition method に よ る シ ス テ ム が も know most rate high が い こ と を か indeed め た.
项目成果
期刊论文数量(13)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Keiichi TOKUDA: "Adaptive Cepstral Analysis of Speech" IEEE Tranis Speech and Audio Processing. 3. 481-489 (1995)
Keiichi TOKUDA:“语音的自适应倒谱分析”IEEE Tranis 语音和音频处理。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Ming-Sheng WANG: "Speech Parsing by Downward Request Search Based on the Divide and Conguer Method" Proc. EUROSPEECH '95. 905-908 (1995)
王明生:“基于分治法的向下请求搜索语音解析”,论文集:
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
胡力游: "中国語連続音声の声調認識" 電子情報通信学会論文誌. J78-A. 763-768 (1995)
胡立宇:《连续汉语语音的声调识别》电子信息与通信工程师学会学报J78-768(1995)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Toshiko ABE: "Harmonic Estimation Based on Instantaneous Frequency and Its Application to Pitch Determination" IEICE Trans. Inf. & Syst.E78-D. 1188-1194 (1995)
Toshiko ABE:“基于瞬时频率的谐波估计及其在音调确定中的应用”IEICE Trans。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
今井聖: "音声信号処理-聴覚の特性を考慮したケプストラム法" 森北出版, 240 (1996)
今井清:《语音信号处理-考虑听觉特征的倒谱法》森北出版,240(1996)
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
今井 聖其他文献
今井 聖的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('今井 聖', 18)}}的其他基金
Research on the Professional Socialization of Legal Instructors in Juvenile Training Schools and its Social Structural Conditions
未成年人培训学校法律辅导员职业社会化及其社会结构条件研究
- 批准号:
22K13657 - 财政年份:2022
- 资助金额:
$ 4.03万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
A Qualitative Research Study on the Practices of Schools and Third-Party Committees Regarding Child Suicide Cases
学校和第三方委员会处理儿童自杀案件实践的定性研究
- 批准号:
21K20242 - 财政年份:2021
- 资助金额:
$ 4.03万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
変形ピリオドグラムの冪関数変換と非線形平滑化によるスペクトル推定
使用变形周期图的幂函数变换和非线性平滑进行频谱估计
- 批准号:
63460124 - 财政年份:1988
- 资助金额:
$ 4.03万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
生成系と聴取系の両者の特性を考慮した音声のモデル化
考虑生产系统和收听系统特征的语音建模
- 批准号:
57460116 - 财政年份:1982
- 资助金额:
$ 4.03万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
対数振幅特性近似フィルタを利用する改良ケプストラム法による音声の分析合成システム
采用对数幅度特性近似滤波器的改进倒谱方法的语音分析与合成系统
- 批准号:
X00080----346111 - 财政年份:1978
- 资助金额:
$ 4.03万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)