HMnetを用いたLSP係数の極低ビットレート符号化法の開発
使用HMnet开发LSP系数的极低比特率编码方法
基本信息
- 批准号:17760293
- 负责人:
- 金额:$ 2.18万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
携帯電話やIP電話等,音声を圧縮・伝送する場合,音声データはLSP係数に変換して伝送される。LSP係数を効率よく圧縮できれば,極低ビットレートで高品質に音声を伝送することが可能となるため,従来より様々な圧縮符号化法が提案されてきた。その中で,セグメント量子化法は時間方向の類似性をよく表現できるため,効率よく符号化することが可能である。この時,LSP係数の時系列をどうやってセグメントに切りわけるか,が性能を大きく左右する重要なポイントである。そこで本研究では,ML-BEATS法(Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence)を提案し,これを用いてLSP係数を効率的に符号化する方法を開発した。まず,以前音響モデル学習用に提案したASP-HMnet作成アルゴリズムをベースに,一般の時系列デーをセグメントに分割し,同時にHMnetでモデル化する方法を提案した。この方法(ML-BEATS法)は,尤度最大基準をもとにセグメント分割を行うため,入力された系列全体に対して最適なセグメントを獲得することができる。更にML-BEATS法を用いてLSP係数を符号化する方法を提案した。この方法でLSP係数の符号化実験を行ったところ,12bit/frameでケプストラム歪が1.64dB程度という結果が得られた。この数字は標準化されている方法のひとつであるG.729(18bit/frame,1.2dB)と比較すると,ビットレートは低いが歪も大きい,という結果であった。そこで更なる歪の低減を目指し,各次元独立に符号化する方法を提案した。LSP係数はもともと低次側から1次元目,2次元目,…としているため,低次側の係数が縮退(や分離)をすると,以降の次元がずれる,という現象が起きてしまう。そこで,LSP係数の各次元を別々に扱い,それぞれ1次元の時系列としてML-BEATS法を適用した。この時,すべての次元を1つのHMnetを用いてモテル化することで,次元がずれた場合にも対処できるようにした。この方法を用いてLSP係数の符号化実験を行ったところ,23bit/frameで1.1dBと,ケプストラム歪を下げることには成功したが,その時のビットレートが従来法に比べて高いものとなってしまった。この原因は,各次元を独立に扱ったため,各次元間の相関を利用していないので比縮効率が下がってしまったためと思われる。
For mobile phones and IP phones, etc., when the voice is compressed and sent, the LSP coefficient of the voice is compressed and sent. LSP coefficient, high efficiency, low compression, high quality sound, extremely low sound, high quality soundすることがpossible and となるため, 従来より様々な姧 shrink symbolization law proposal されてきた.その中で, セグメントquantization method はsimilarity in the time direction をよくexpression できるため, efficiency よくsymbolization することがpossible である.この时, LSP coefficient の时 series をどうやってセグメントに Cut りわけるか, がperformance を大きくleft and right するimportant なポイントである. This study proposes a proposal for the ML-BEATS method (Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence), and develops a method to symbolize efficiency using LSP coefficients.まず, I used ににしたASP-HMnet made by ににたたしたにルゴリズムをベースに, which I used to learn audio, The general time series is divided into parts, and the HMnet method is proposed at the same time.このmethod(ML-BEATSmethod)は,The maximum standard of the degree is the segmentation lineうため, enter the force された series all に対して the most suitable なセグメントをget することができる. A new method of symbolizing LSP coefficients using the ML-BEATS method has been proposed.このmethodでLSP coefficient symbolization 実験を行ったところ, 12bit/frame でケプストラムskew 1.64dB degree and the result is られた.このdigital standardization method のひとつであるG.729(18bit/frame ,1.2dB)とComparisonすると,ビットレートはlowerいがskewも大きい,というRESULTSであった. This is a new way to reduce the size of the object, and to propose a method of symbolizing each dimension independently. The LSP coefficient is the low-order side, the 1-dimensional object, the 2-dimensional object,... the low-order side. The coefficient が shrinks (や separates) を す る と, and the の dimension が ず れ る, と い う phenomenon が rises き て し ま う.そこで, LSP coefficient of each dimension is different, それぞれ1-dimensional time series is applicable to ML-BEATS method.この时,すべてのdimensional を1つのHMnetを用いてモテル化することで, dimensional がずれた occasion にも対区 できるようにした.このmethodをUsing いてLSP coefficients to symbolize 実験を行ったところ,23bit/frameで1.1dBと,ケプスしたが, その时のビットレートが従法に比べて高いものとなってしまった. The reasons why each dimension is independent and the correlation between dimensions are the benefits Use it to reduce the efficiency of using it.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ML-BEATS法を用いたLSP係数の極低ビットレート符号化法の検討
基于ML-BEATS方法的LSP系数极低码率编码方法研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:鈴木基之
- 通讯作者:鈴木基之
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鈴木 基之其他文献
Spotify音楽データを用いたユーザの感情に基づく音楽推薦手法の提案
利用Spotify音乐数据提出基于用户情感的音乐推荐方法
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Yukonhiatou Chaxiong;Yoshihisa Tomoki;Kawakami Tomoya;Teranishi Yuuichi;Shimojo Shinji;撫佐昭裕;鈴木 基之;鈴木基之;曽田円香,志風美雨,辻愛美紗,中野美由紀 - 通讯作者:
曽田円香,志風美雨,辻愛美紗,中野美由紀
鈴木 基之的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鈴木 基之', 18)}}的其他基金
HPV関連中咽頭癌の前癌病変の同定と自然史の解明に基づくバイオマーカーの探索
基于癌前病变的识别和 HPV 相关口咽癌自然史的阐明来寻找生物标志物
- 批准号:
24K12671 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a mutual conversion method between face image and voice during speech
语音时人脸图像与声音相互转换方法的开发
- 批准号:
22K12916 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
離散型HMnetを用いた音声認識システム用言語モデルの自動獲得手法の開発
基于离散HMnet的语音识别系统自动语言模型获取方法的开发
- 批准号:
11780244 - 财政年份:1999
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
環境汚染物質の人体影響評価のための簡易模擬人体システムの開発に関する基礎研究
开发简单人体系统评估环境污染物对人体影响的基础研究
- 批准号:
08878072 - 财政年份:1996
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Exploratory Research
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
08358022 - 财政年份:1996
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
07355015 - 财政年份:1995
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Co-operative Research (B)
人間-環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
04202114 - 财政年份:1993
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
03202115 - 财政年份:1991
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
古代〜中世の錘の研究
古代至中世纪重量的研究
- 批准号:
02904041 - 财政年份:1990
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
02202112 - 财政年份:1990
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas














{{item.name}}会员




