A Study on Efficient Speech Coding Systems with Auditory Filters

具有听觉滤波器的高效语音编码系统的研究

基本信息

  • 批准号:
    11650392
  • 负责人:
  • 金额:
    $ 1.09万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    1999
  • 资助国家:
    日本
  • 起止时间:
    1999 至 2000
  • 项目状态:
    已结题

项目摘要

In this study, a very low bit speech coder at 1.2 kbps is newly proposed. Like the LPC vocoder, it requures few types of information (power, pitch, and spectral information), but its quality is far superuor. In the proposed vocoder, the synthesized speech quality is improved based on auditory perceptualcharacterustics. The synthesis method is one of harmonic coding, using sinusoids whose frequencies are multiples of the fundamental frequency, where the amplitudes of the sinusoids are adaptively modulated using Gammatone filters as a perceptual weighting filter. The sinusoids' phases are also adjusted so as to maximize the perceptual quality. In order to reduce the total bit rate to 1.2 kbps, a new segment coder for spectral information (LSP coefficients) using DP matching is also proposed. The quality of the synthesized speech is considerably improved compared with that of the simple LPC vocoder, according to MOS and other preference tests.
在这项研究中,在1.2 kbps的极低比特语音编码器是新提出的。像LPC声码器一样,它需要的信息类型很少(功率、音调和频谱信息),但其质量远远优于LPC声码器。在该声码器中,基于听觉感知特性提高了合成语音的质量。合成方法是谐波编码的一种,使用其频率是基频的倍数的正弦波,其中正弦波的幅度使用伽马通滤波器作为感知加权滤波器进行自适应调制。正弦曲线的相位也被调整,以便最大化感知质量。为了减少总的比特率为1.2 kbps,一个新的段编码器的频谱信息(LSP系数)使用DP匹配也被提出。通过MOS测试和其它性能测试,与简单LPC声码器相比,合成语音质量有了很大的提高。

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M.Kohata,I,Mitsuya,M.Suzuki, S.Makino: "Efficient segment quantization of LSP coefficients for very low bit speech coding"Proc.Int.Conf.on Spoken Language Processing. 2000.3. 826-829 (2000)
M.Kohata,I,Mitsuya,M.Suzuki,S.Makino:“用于极低位语音编码的 LSP 系数的有效分段量化”Proc.Int.Conf.on 口语语言处理。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M.Kohata,I.Mitsuya,M.Suzuki,S.Makino: "Efficient segment quantization of LSP Coefficients for very low bit speech coding"Proc.Int.Conf.on Spoken Language Processing. 2000・3. 826-829 (2000)
M.Kohata、I.Mitsuya、M.Suzuki、S.Makino:“用于极低位语音编码的 LSP 系数的有效分段量化”Proc.Int.Conf.on 口语语言处理 2000・3(2000 年)。 )
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
M.Kohata, I.Mitsuya, M.Suzuki, S.Mokino: "Efficient segment quantization of LSP coefficients for very low bit speech coding"Proc.Int.Conf.on Spoken Language Processing. vol.2000.3. 826-829 (2000)
M.Kohata、I.Mitsuya、M.Suzuki、S.Mokino:“用于极低位语音编码的 LSP 系数的高效分段量化”Proc.Int.Conf.on 口语语言处理。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
木幡 稔: "正弦波重畳型ボコーダによる1.2kbit/s音声符号化方式"電子情報通信学会論文誌. J82-D-II 3__-. 340-349 (1999)
Minoru Kobata:“使用正弦波叠加声码器的1.2kbit/s语音编码方法”电子、信息和通信工程师学会杂志J82-D-II 3__-340-349(1999)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

KOHATA Minoru其他文献

KOHATA Minoru的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('KOHATA Minoru', 18)}}的其他基金

A Study on Speech Coding by Speech Synthesis
语音合成语音编码研究
  • 批准号:
    22500165
  • 财政年份:
    2010
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A study on a very low bit-rate speech coder based upon self similarity of speech signal.
基于语音信号自相似性的极低码率语音编码器的研究
  • 批准号:
    14550370
  • 财政年份:
    2002
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Very Low Bit Speech Coding Using Fractal Systems.
使用分形系统的极低比特语音编码。
  • 批准号:
    08650418
  • 财政年份:
    1996
  • 资助金额:
    $ 1.09万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了