HMnetを用いたLSP係数の極低ビットレート符号化法の開発
使用HMnet开发LSP系数的极低比特率编码方法
基本信息
- 批准号:17760293
- 负责人:
- 金额:$ 2.18万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
携帯電話やIP電話等,音声を圧縮・伝送する場合,音声データはLSP係数に変換して伝送される。LSP係数を効率よく圧縮できれば,極低ビットレートで高品質に音声を伝送することが可能となるため,従来より様々な圧縮符号化法が提案されてきた。その中で,セグメント量子化法は時間方向の類似性をよく表現できるため,効率よく符号化することが可能である。この時,LSP係数の時系列をどうやってセグメントに切りわけるか,が性能を大きく左右する重要なポイントである。そこで本研究では,ML-BEATS法(Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence)を提案し,これを用いてLSP係数を効率的に符号化する方法を開発した。まず,以前音響モデル学習用に提案したASP-HMnet作成アルゴリズムをベースに,一般の時系列デーをセグメントに分割し,同時にHMnetでモデル化する方法を提案した。この方法(ML-BEATS法)は,尤度最大基準をもとにセグメント分割を行うため,入力された系列全体に対して最適なセグメントを獲得することができる。更にML-BEATS法を用いてLSP係数を符号化する方法を提案した。この方法でLSP係数の符号化実験を行ったところ,12bit/frameでケプストラム歪が1.64dB程度という結果が得られた。この数字は標準化されている方法のひとつであるG.729(18bit/frame,1.2dB)と比較すると,ビットレートは低いが歪も大きい,という結果であった。そこで更なる歪の低減を目指し,各次元独立に符号化する方法を提案した。LSP係数はもともと低次側から1次元目,2次元目,…としているため,低次側の係数が縮退(や分離)をすると,以降の次元がずれる,という現象が起きてしまう。そこで,LSP係数の各次元を別々に扱い,それぞれ1次元の時系列としてML-BEATS法を適用した。この時,すべての次元を1つのHMnetを用いてモテル化することで,次元がずれた場合にも対処できるようにした。この方法を用いてLSP係数の符号化実験を行ったところ,23bit/frameで1.1dBと,ケプストラム歪を下げることには成功したが,その時のビットレートが従来法に比べて高いものとなってしまった。この原因は,各次元を独立に扱ったため,各次元間の相関を利用していないので比縮効率が下がってしまったためと思われる。
Mobile phones, IP phones, etc., voice compression and transmission, voice transmission and LSP coefficient conversion LSP coefficients are reduced in pressure, extremely low in pitch, and high in quality. The quantization method is similar to the time direction, and the efficiency is symbolic. The LSP coefficient is a time-series parameter, which is important for performance. In this paper,ML-BEATS (Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence) is proposed, and a symbolic method for LSP coefficient estimation is developed. In the past, ASP-HMnet has been proposed to create a new system for audio and video learning, and to divide the system into general time series and HMnet. This method (ML-BEATS method) is especially suitable for the maximum reference point, and the maximum reference point. In addition, ML-BEATS method is proposed to symbolize LSP coefficients. This method gives the LSP coefficients a symbolic value of 1.64 dB at 12bit/frame. This number is standardized by the method of G.729(18bit/frame, 1.2dB) and compared with the result of G.729. The method of symbolizing each dimension independently is proposed. LSP coefficients are reduced in order to decrease the dimension of LSP coefficients. LSP coefficients are reduced in order to decrease the dimension of LSP coefficients. The LSP coefficients are divided into two dimensions, namely, the first dimension and the second dimension. When the time comes, the first dimension of the HMnet is used. This method uses the notation of LSP coefficients to achieve the desired result,23bit/frame = 1.1 dB, and the desired result is achieved when the LSP coefficients are used. The reason for this is that each dimension is independent, and the correlation between each dimension is utilized.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ML-BEATS法を用いたLSP係数の極低ビットレート符号化法の検討
基于ML-BEATS方法的LSP系数极低码率编码方法研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:鈴木基之
- 通讯作者:鈴木基之
{{
                item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:{{ item.author }} 
数据更新时间:{{ patent.updateTime }}
鈴木 基之其他文献
Spotify音楽データを用いたユーザの感情に基づく音楽推薦手法の提案
利用Spotify音乐数据提出基于用户情感的音乐推荐方法
- DOI:
- 发表时间:2023 
- 期刊:
- 影响因子:0
- 作者:Yukonhiatou Chaxiong;Yoshihisa Tomoki;Kawakami Tomoya;Teranishi Yuuichi;Shimojo Shinji;撫佐昭裕;鈴木 基之;鈴木基之;曽田円香,志風美雨,辻愛美紗,中野美由紀 
- 通讯作者:曽田円香,志風美雨,辻愛美紗,中野美由紀 
鈴木 基之的其他文献
{{
              item.title }}
{{ item.translation_title }}
- DOI:{{ item.doi }} 
- 发表时间:{{ item.publish_year }} 
- 期刊:
- 影响因子:{{ item.factor }}
- 作者:{{ item.authors }} 
- 通讯作者:{{ item.author }} 
{{ truncateString('鈴木 基之', 18)}}的其他基金
HPV関連中咽頭癌の前癌病変の同定と自然史の解明に基づくバイオマーカーの探索
基于癌前病变的识别和 HPV 相关口咽癌自然史的阐明来寻找生物标志物
- 批准号:24K12671 
- 财政年份:2024
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Scientific Research (C) 
Development of a mutual conversion method between face image and voice during speech
语音时人脸图像与声音相互转换方法的开发
- 批准号:22K12916 
- 财政年份:2022
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Scientific Research (C) 
離散型HMnetを用いた音声認識システム用言語モデルの自動獲得手法の開発
基于离散HMnet的语音识别系统自动语言模型获取方法的开发
- 批准号:11780244 
- 财政年份:1999
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (A) 
環境汚染物質の人体影響評価のための簡易模擬人体システムの開発に関する基礎研究
开发简单人体系统评估环境污染物对人体影响的基础研究
- 批准号:08878072 
- 财政年份:1996
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Exploratory Research 
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:08358022 
- 财政年份:1996
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Scientific Research (B) 
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:07355015 
- 财政年份:1995
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Co-operative Research (B) 
人間-環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:04202114 
- 财政年份:1993
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas 
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:03202115 
- 财政年份:1991
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas 
古代〜中世の錘の研究
古代至中世纪重量的研究
- 批准号:02904041 
- 财政年份:1990
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Encouragement of Young Scientists (B) 
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:02202112 
- 财政年份:1990
- 资助金额:$ 2.18万 
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas 

 刷新
              刷新
            
















 {{item.name}}会员
              {{item.name}}会员
            



