权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

HMnetを用いたLSP係数の極低ビットレート符号化法の開発

使用HMnet开发LSP系数的极低比特率编码方法

基本信息

批准号：
17760293
负责人：
鈴木基之
金额：
$ 2.18万
依托单位：
Tohoku University
依托单位国家：
日本
项目类别：
Grant-in-Aid for Young Scientists (B)
财政年份：
2005
资助国家：
日本
起止时间：
2005 至 2006
项目状态：
已结题

来源：
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-17760293/
关键词：
音声符号化セグメント量子化 ML-BEATS法 HMnet

项目摘要

携帯電話やIP電話等,音声を圧縮・伝送する場合,音声データはLSP係数に変換して伝送される。LSP係数を効率よく圧縮できれば,極低ビットレートで高品質に音声を伝送することが可能となるため,従来より様々な圧縮符号化法が提案されてきた。その中で,セグメント量子化法は時間方向の類似性をよく表現できるため,効率よく符号化することが可能である。この時,LSP係数の時系列をどうやってセグメントに切りわけるか,が性能を大きく左右する重要なポイントである。そこで本研究では,ML-BEATS法(Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence)を提案し,これを用いてLSP係数を効率的に符号化する方法を開発した。まず,以前音響モデル学習用に提案したASP-HMnet作成アルゴリズムをベースに,一般の時系列デーをセグメントに分割し,同時にHMnetでモデル化する方法を提案した。この方法(ML-BEATS法)は,尤度最大基準をもとにセグメント分割を行うため,入力された系列全体に対して最適なセグメントを獲得することができる。更にML-BEATS法を用いてLSP係数を符号化する方法を提案した。この方法でLSP係数の符号化実験を行ったところ,12bit/frameでケプストラム歪が1.64dB程度という結果が得られた。この数字は標準化されている方法のひとつであるG.729(18bit/frame,1.2dB)と比較すると,ビットレートは低いが歪も大きい,という結果であった。そこで更なる歪の低減を目指し,各次元独立に符号化する方法を提案した。LSP係数はもともと低次側から1次元目,2次元目,…としているため,低次側の係数が縮退(や分離)をすると,以降の次元がずれる,という現象が起きてしまう。そこで,LSP係数の各次元を別々に扱い,それぞれ1次元の時系列としてML-BEATS法を適用した。この時,すべての次元を1つのHMnetを用いてモテル化することで,次元がずれた場合にも対処できるようにした。この方法を用いてLSP係数の符号化実験を行ったところ,23bit/frameで1.1dBと,ケプストラム歪を下げることには成功したが,その時のビットレートが従来法に比べて高いものとなってしまった。この原因は,各次元を独立に扱ったため,各次元間の相関を利用していないので比縮効率が下がってしまったためと思われる。

For mobile phones and IP phones, etc., when the voice is compressed and sent, the LSP coefficient of the voice is compressed and sent. LSP coefficient, high efficiency, low compression, high quality sound, extremely low sound, high quality soundすることがpossible and となるため, 従来より様々な姧 shrink symbolization law proposal されてきた.その中で, セグメントquantization method はsimilarity in the time direction をよくexpression できるため, efficiency よくsymbolization することがpossible である.この时, LSP coefficient の时 series をどうやってセグメントに Cut りわけるか, がperformance を大きくleft and right するimportant なポイントである. This study proposes a proposal for the ML-BEATS method (Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence), and develops a method to symbolize efficiency using LSP coefficients.まず, I used ににしたASP-HMnet made by ににたたしたにルゴリズムをベースに, which I used to learn audio, The general time series is divided into parts, and the HMnet method is proposed at the same time.このmethod(ML-BEATSmethod)は,The maximum standard of the degree is the segmentation lineうため, enter the force された series all に対して the most suitable なセグメントをget することができる. A new method of symbolizing LSP coefficients using the ML-BEATS method has been proposed.このmethodでLSP coefficient symbolization 実験を行ったところ, 12bit/frame でケプストラムskew 1.64dB degree and the result is られた.このdigital standardization method のひとつであるG.729(18bit/frame ,1.2dB)とComparisonすると,ビットレートはlowerいがskewも大きい,というRESULTSであった. This is a new way to reduce the size of the object, and to propose a method of symbolizing each dimension independently. The LSP coefficient is the low-order side, the 1-dimensional object, the 2-dimensional object,... the low-order side. The coefficient が shrinks (や separates) をすると, and the の dimension がずれる, という phenomenon が rises きてしまう.そこで, LSP coefficient of each dimension is different, それぞれ1-dimensional time series is applicable to ML-BEATS method.この时,すべてのdimensional を1つのHMnetを用いてモテル化することで, dimensional がずれた occasion にも対区できるようにした.このmethodをUsing いてLSP coefficients to symbolize 実験を行ったところ,23bit/frameで1.1dBと,ケプスしたが, その时のビットレートが従法に比べて高いものとなってしまった. The reasons why each dimension is independent and the correlation between dimensions are the benefits Use it to reduce the efficiency of using it.

项目成果

期刊论文数量（0）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

ML-BEATS法を用いたLSP係数の極低ビットレート符号化法の検討

基于ML-BEATS方法的LSP系数极低码率编码方法研究

DOI：
发表时间：
2006
期刊：
東北大学電気通信研究所音響工学研究会予稿集 343-2
影响因子：
0
作者：
鈴木基之
通讯作者：
鈴木基之

DOI：
{{ item.doi }}
发表时间：
{{ item.publish_year }}
期刊：
{{ item.journal_name }}
影响因子：
{{ item.factor }}
作者：
{{ item.authors }}
通讯作者：
{{ item.author }}

数据更新时间：{{ journalArticles.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ monograph.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ sciAawards.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ conferencePapers.updateTime }}

作者：
{{ item.author }}

数据更新时间：{{ patent.updateTime }}

鈴木基之其他文献

Spotify音楽データを用いたユーザの感情に基づく音楽推薦手法の提案

利用Spotify音乐数据提出基于用户情感的音乐推荐方法

DOI：
发表时间：
2023
期刊：
影响因子：
0
作者：
Yukonhiatou Chaxiong;Yoshihisa Tomoki;Kawakami Tomoya;Teranishi Yuuichi;Shimojo Shinji;撫佐昭裕;鈴木基之;鈴木基之;曽田円香，志風美雨，辻愛美紗，中野美由紀
通讯作者：
曽田円香，志風美雨，辻愛美紗，中野美由紀