リカレントニューラルネットワークを用いた極低ビット音声符号化方式の開発

利用循环神经网络开发极低比特语音编码方法

基本信息

  • 批准号:
    07750395
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1995
  • 资助国家:
    日本
  • 起止时间:
    1995 至 无数据
  • 项目状态:
    已结题

项目摘要

本研究では,音声の低歪,低ビット符号化への応用を目的として,時間変化パタンの記憶,再生能力を有するリカレントニューラルネットワーク(RNN)を,音声のスペクトルパタンの補間に用いる符号化方式を提案した.提案したRNN補間器は多次元の時間変化パタンをその始端と終端の値のみから補間して復元する機能を有する.本研究では,まずRNN補間器の学習方法として,選択的通時的誤差逆伝播法(BPSS)を導く.これは時間的誤差逆伝播法(BPTT)を基にした方法で,1つのRNNに対して複数パタンの補間を行なわせることが可能となった.次に,RNN補間器の能力を評価するため,多項式から作成した時間変化パタンを被補間パタンとして用いた実験を行なうことにより補間器の基本特性を測定した.そして,音声信号のスペクトル情報を表わすパラメータの1つであるLSP係数の符号化へRNN補間器を応用する具体的方法について述べ,シミュレーションにより符号化後の音声のスペクトル歪を測定し,他の補間法を用いた場合との比較を行なった.その結果,スペクトル情報のみの符号化に際して,伝送レート約300bpsにおいて線形補間よりスペクトル歪が0.5dB減少し,主観評価実験の結果においても音質の向上が認められた.
This study で は, low voice の slanting, low ビ ッ ト symbolic へ の 応 purpose を と し て, time - the パ タ ン の memory, regeneration を have す る リ カ レ ン ト ニ ュ ー ラ ル ネ ッ ト ワ ー ク (RNN) を, sounds の ス ペ ク ト ル パ タ ン の curation に with い る symbolic way を proposal し た. Proposal し た between RNN filling device は multidimensional の time variations change パ タ ン を そ の signalling と terminal の numerical の み か ら curation し て recovery す る function を have す る. This study で は, ま ず between RNN filling device の learning methods と し て, sentaku pass when the error of the inverse 伝 sowing method (BPSS) を く. こ れ は time error inverse 伝 seeding method (BPTT) を に し で た method, 1 つ の RNN に し seaborne て plural パ タ ン の filling line between を な わ せ る こ と が may と な っ た. に, implement の ability between RNN fill を review 価 す る た め, polynomial か ら made し た time variations change パ タ ン を is filled between パ タ ン と し て in い た be 験 を line な う こ と に よ り filling machine の basic characteristics between を determination し た. そ し て, voice signal の ス ペ ク ト ル intelligence を table わ す パ ラ メ ー タ の 1 つ で あ る LSP coefficients の symbolic へ between RNN fill Implement を 応 with す る concrete ways に つ い て べ, シ ミ ュ レ ー シ ョ ン に よ り symbolic after の sounds の ス ペ ク ト ル slanting を し, he の fill method between を with い た occasions と の is line を な っ た. そ の results, ス ペ ク ト ル intelligence の み の symbolic に interstate し て, 伝 send レ ー ト around 300 BPS に お い て between linear filling よ り ス ペ ク ト ル slanting Youdaoplaceholder0 0.5dB is reduced by が. The main 観 evaluates the 価 experimental <s:1> result: にお て て <s:1> the sound quality <s:1> is upward が recognized められた.

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
木幡 稔: "リカレントニューラルネットワークを用いた補間法とその音声符号化への応用" 電子情報通信学会論文誌D-II. J79DII(発表予定). (1996)
Minoru Kobata:“使用循环神经网络的插值方法及其在语音编码中的应用”IEICE Transactions D-II(待提交)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

木幡 稔其他文献

3-2-11
11年3月2日
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    竹田 翔;木幡 稔
  • 通讯作者:
    木幡 稔
EMM2011-66
EMM2011-66
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    YOSHIDA Hiromi;NAGAMATSU Takashi;TANAKA Naoki;張興国;木幡 稔
  • 通讯作者:
    木幡 稔
言い真似に基づく音声符号化における話者適応法の検討
基于模仿的语音编码中说话人自适应方法的研究
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    YOSHIDA Hiromi;NAGAMATSU Takashi;TANAKA Naoki;張興国;木幡 稔;土田寛子;T.Shiota and T. Nishitani;竹田翔
  • 通讯作者:
    竹田翔
1-Q-12
1-Q-12
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    猿田和樹,高橋圭,矢島陽介;寺田裕樹,陳国躍;茂泉拓紀;木幡 稔
  • 通讯作者:
    木幡 稔
Precise and Stable Silhouette Extraction
精确稳定的轮廓提取
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    YOSHIDA Hiromi;NAGAMATSU Takashi;TANAKA Naoki;張興国;木幡 稔;土田寛子;T.Shiota and T. Nishitani
  • 通讯作者:
    T.Shiota and T. Nishitani

木幡 稔的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('木幡 稔', 18)}}的其他基金

ニューラルネットワークを用いた音声信号の極低ビット符号化システムの開発
使用神经网络开发音频信号极低比特编码系统
  • 批准号:
    06750409
  • 财政年份:
    1994
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
超円柱クラスタによるファジィベクトル量子化法の開発
利用超圆柱簇的模糊矢量量化方法的发展
  • 批准号:
    04750265
  • 财政年份:
    1992
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
ファジイ理論を用いた音声信号のベクトル量子化法の開発
利用模糊理论开发音频信号矢量量化方法
  • 批准号:
    02750220
  • 财政年份:
    1990
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
ファジイ理論を用いた音声信号のベクトル量子化法の開発
利用模糊理论开发音频信号矢量量化方法
  • 批准号:
    63750310
  • 财政年份:
    1988
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)

相似海外基金

HMnetを用いたLSP係数の極低ビットレート符号化法の開発
使用HMnet开发LSP系数的极低比特率编码方法
  • 批准号:
    17760293
  • 财政年份:
    2005
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了