音声データ圧縮・蓄積システムの高品質・低ビットレート化に関する研究
高质量低码率音频数据压缩与存储系统研究
基本信息
- 批准号:06750373
- 负责人:
- 金额:$ 0.58万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
1.従来の線形予測法にかえて,メルケプストラム分析法を利用したCELP音声符号化系を考案した.メルケプストラムを利用することにより,人間の聴覚特性を利用することが容易となった.2.メルケプストラム分析を用いた音声符号化系をワークステーション上で実現し,様々な標本化周波数,データレートに対応できるような拡張を行なった.3.実現したプログラムから総演算量を見積もり,演算量を削減する工夫をした.4.多くの音声データにより実際の符号化を行い,SN比などの客観評価により,実現された符号化システムの細部に渡る最適化を行なった.5.提案したメルケプストラム分析を用いた音声符号化系は,従来の線形予測法を用いた符号化系に比べ高いSN比をもつ.シミュレーションにより,従来法に比べ,約1dBの改善が達成されることを示した.6.この結果から,提案法は従来法に比べ高い音声品質をもつことが期待できるが,このような有効性を明らかにするためには,定量的な音声品質の評価を行わなければならない.本研究では,数十名程度の被験者による受聴試験に基づいて提案方式を従来方式と比較し,その優位性を示した.その結果,提案法は従来法に比較し,同じビットレートで,約1.8dBの改善を達成することができた.7.以上により,メルケプストラム分析のCELP音声符号化系における有効性が明かとなったが,今後はMBEなど他の音声符号化系におけるメルケプストラム分析の有効性についても検討していく予定である.
1. A case study of CELP sound symbolization system is carried out by using the linear prediction method. 2. The analysis of sound and sound symbolization system is carried out on the system, and the frequency of sound and sound is calculated. 3. The calculation of sound and sound is carried out on the system. The algorithm reduces the time. 4. Multi-channel acoustic data analysis is used in the process of symbolization,SN ratio and customer evaluation. 5. Proposal is used in the process of symbolization and detail optimization. 6. The results show that the proposed method has a higher sound quality than the original method. This study shows the superiority of the proposed method and the comparative method among dozens of subjects. The results show that the proposed method achieves an improvement of about 1.8 dB compared with the previous method. 7. The above results show that the CELP acoustic symbolization system analyzed by MBE has the same effectiveness as that analyzed by MBE in the future.
项目成果
期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
K.Koishida,K.Tokuda,T.kobayashi and S.Imai: "CELP coding based on mel-cepstral analysis" Proceedings of International Conference on Acoustics,Speech,and Signal Processing. (採録決定済). (1995)
K. Koishida、K. Tokuda、T. kobayashi 和 S. Imai:“基于梅尔倒谱分析的 CELP 编码”国际声学、语音和信号处理会议论文集(已接受)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
徳田 恵一其他文献
英語音声合成における韻律推定モデルと音響モデルの同時学習
英语语音合成中韵律估计模型和声学模型的同时学习
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
大浦 圭一郎;戸田 智基;南角 吉彦;徳田 恵一;マイアハニエリ;坂井 信輔;中村 哲 - 通讯作者:
中村 哲
Blizzar Challenge 2007のための平均声に基づくHMM音声合成システムの評価
2007 年暴雪挑战赛基于平均语音的 HMM 语音合成系统评估
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
能勢 隆;山岸 順一;全 柄河;戸田 智基;徳田 恵一 - 通讯作者:
徳田 恵一
Knowledge-based Discovery in Systems Biology using CF-Induction.
使用 CF-Induction 在系统生物学中进行基于知识的发现。
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
全 柄河;南角 吉彦;徳田 恵一;Andrei Doncescu - 通讯作者:
Andrei Doncescu
F0量子化と非パラレル学習に基づく声質変換の評価
基于F0量化和非并行学习的语音质量转换评估
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
深渡瀬 智史,入野 俊夫,西村 竜一,河原 英紀;Roy D. Patterson;徳田 恵一;太田悠平 - 通讯作者:
太田悠平
徳田 恵一的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('徳田 恵一', 18)}}的其他基金
深層学習に基づいた新世代音声・オーディオ信号生成に関する研究
基于深度学习的新一代语音音频信号生成研究
- 批准号:
23K24870 - 财政年份:2024
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Next-generation audio and speech processing architectures based on deep learning
基于深度学习的下一代音频和语音处理架构
- 批准号:
22H03614 - 财政年份:2022
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
t分布仮定に基づくロバストスペクトル推定
基于t分布假设的鲁棒谱估计
- 批准号:
97F00343 - 财政年份:1998
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for JSPS Fellows
マルチモーダル音声認識・合成によるインターフェースの構築
使用多模态语音识别和合成构建界面
- 批准号:
10780226 - 财政年份:1998
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-
使用隐马尔可夫模型进行极低比特率语音编码的识别声码器
- 批准号:
08780333 - 财政年份:1996
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた音声の規則合成-喜怒哀楽の表現を目指して-
使用隐马尔可夫模型规则合成语音 - 旨在表达喜、怒、哀、乐 -
- 批准号:
07858043 - 财政年份:1995
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
適応メルケプストラム分析法に基づく音声の高能率符号化法に関する研究
基于自适应梅尔倒谱分析方法的高效语音编码方法研究
- 批准号:
04750270 - 财政年份:1992
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
時変複素AR(TV-CAR)音声分析法の高度化と音声符号化・音声認識処理への適用
时变复杂AR(TV-CAR)语音分析方法及其在语音编码和语音识别处理中的应用进展
- 批准号:
12750344 - 财政年份:2000
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
極低ビットレート音声符号化のための音声認識・合成系の検討
超低码率语音编码的语音识别/合成系统研究
- 批准号:
09750399 - 财政年份:1997
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
隠れマルコフモデルを用いた認識ボコーダー極低ビットレート音声符号化-
使用隐马尔可夫模型进行极低比特率语音编码的识别声码器
- 批准号:
08780333 - 财政年份:1996
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
リカレントニューラルネットワークを用いた極低ビット音声符号化方式の開発
利用循环神经网络开发极低比特语音编码方法
- 批准号:
07750395 - 财政年份:1995
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
マルチパルス音声符号化法を利用した相関係の試作と音響伝搬特性解析への適用
使用多脉冲音频编码方法的相关原型及其在声学传播特性分析中的应用
- 批准号:
62918020 - 财政年份:1987
- 资助金额:
$ 0.58万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)