HMnetを用いたLSP係数の極低ビットレート符号化法の開発
使用HMnet开发LSP系数的极低比特率编码方法
基本信息
- 批准号:17760293
- 负责人:
- 金额:$ 2.18万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
携帯電話やIP電話等,音声を圧縮・伝送する場合,音声データはLSP係数に変換して伝送される。LSP係数を効率よく圧縮できれば,極低ビットレートで高品質に音声を伝送することが可能となるため,従来より様々な圧縮符号化法が提案されてきた。その中で,セグメント量子化法は時間方向の類似性をよく表現できるため,効率よく符号化することが可能である。この時,LSP係数の時系列をどうやってセグメントに切りわけるか,が性能を大きく左右する重要なポイントである。そこで本研究では,ML-BEATS法(Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence)を提案し,これを用いてLSP係数を効率的に符号化する方法を開発した。まず,以前音響モデル学習用に提案したASP-HMnet作成アルゴリズムをベースに,一般の時系列デーをセグメントに分割し,同時にHMnetでモデル化する方法を提案した。この方法(ML-BEATS法)は,尤度最大基準をもとにセグメント分割を行うため,入力された系列全体に対して最適なセグメントを獲得することができる。更にML-BEATS法を用いてLSP係数を符号化する方法を提案した。この方法でLSP係数の符号化実験を行ったところ,12bit/frameでケプストラム歪が1.64dB程度という結果が得られた。この数字は標準化されている方法のひとつであるG.729(18bit/frame,1.2dB)と比較すると,ビットレートは低いが歪も大きい,という結果であった。そこで更なる歪の低減を目指し,各次元独立に符号化する方法を提案した。LSP係数はもともと低次側から1次元目,2次元目,…としているため,低次側の係数が縮退(や分離)をすると,以降の次元がずれる,という現象が起きてしまう。そこで,LSP係数の各次元を別々に扱い,それぞれ1次元の時系列としてML-BEATS法を適用した。この時,すべての次元を1つのHMnetを用いてモテル化することで,次元がずれた場合にも対処できるようにした。この方法を用いてLSP係数の符号化実験を行ったところ,23bit/frameで1.1dBと,ケプストラム歪を下げることには成功したが,その時のビットレートが従来法に比べて高いものとなってしまった。この原因は,各次元を独立に扱ったため,各次元間の相関を利用していないので比縮効率が下がってしまったためと思われる。
Carry telephone, IP telephone, etc., audio phone, audio phone, LSP phone, etc., audio phone, phone, etc. The LSP counts the frequency, the quality, the sound, the quality, the sound, the sound, the sound In the middle of the experiment, the quantization method is used to quantize the time direction similarity to show that it is not valid, and the rate is very low. At the same time, the series of LSP functions are used to ensure that the performance is high, and the performance is very important. In this study, the proposal of ML-BEATS (Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence) method is proposed, and the symbolic method of LSP count rate is used in this study. In the past, the proposed ASP-HMnet was used to make a real-time series of audio-visual information. In general, it was segmented by a series of audio-visual ASP-HMnet, and the proposed method was implemented at the same time. The method (ML-BEATS method), especially the maximum standard method, is used to split the line, and the whole series of data is used to get the best results. The ML-BEATS method uses the "LSP" number to symbolize the "proposal" method. The method LSP number symbolizes the number of lines, and the 12bit/frame number indicates that the 1.64dB degree is skewed. The results show that the results are correct. The number is standardized and the method is used to determine the accuracy of G.729 (18bit frame frame 1.2dB). The results show that the error is lower than that of the previous one. Each dimension is independent of symbolization and the method is proposed. LSP counts the first meta, the 2nd meta, the lower order meta. In order to reduce the size of the data, the number of times is low, the number of times is low, and the number of times is low. For example, the LSP number of each dimension is different, and the one-dimensional series of ML-BEATS method is used. At the same time, you need to change the number of parameters in the HMnet to make sure that the data is correct. The method uses the number of LSP numbers to symbolize the number of messages, 23bit/frame the number, the error error, the error number, the number of times, and the number of times. The reason is that each dimension is independent of each other, and each dimension is independent of each other.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ML-BEATS法を用いたLSP係数の極低ビットレート符号化法の検討
基于ML-BEATS方法的LSP系数极低码率编码方法研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:鈴木基之
- 通讯作者:鈴木基之
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鈴木 基之其他文献
Spotify音楽データを用いたユーザの感情に基づく音楽推薦手法の提案
利用Spotify音乐数据提出基于用户情感的音乐推荐方法
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Yukonhiatou Chaxiong;Yoshihisa Tomoki;Kawakami Tomoya;Teranishi Yuuichi;Shimojo Shinji;撫佐昭裕;鈴木 基之;鈴木基之;曽田円香,志風美雨,辻愛美紗,中野美由紀 - 通讯作者:
曽田円香,志風美雨,辻愛美紗,中野美由紀
鈴木 基之的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鈴木 基之', 18)}}的其他基金
HPV関連中咽頭癌の前癌病変の同定と自然史の解明に基づくバイオマーカーの探索
基于癌前病变的识别和 HPV 相关口咽癌自然史的阐明来寻找生物标志物
- 批准号:
24K12671 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a mutual conversion method between face image and voice during speech
语音时人脸图像与声音相互转换方法的开发
- 批准号:
22K12916 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
離散型HMnetを用いた音声認識システム用言語モデルの自動獲得手法の開発
基于离散HMnet的语音识别系统自动语言模型获取方法的开发
- 批准号:
11780244 - 财政年份:1999
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
環境汚染物質の人体影響評価のための簡易模擬人体システムの開発に関する基礎研究
开发简单人体系统评估环境污染物对人体影响的基础研究
- 批准号:
08878072 - 财政年份:1996
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Exploratory Research
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
08358022 - 财政年份:1996
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
07355015 - 财政年份:1995
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Co-operative Research (B)
人間-環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
04202114 - 财政年份:1993
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
03202115 - 财政年份:1991
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
古代〜中世の錘の研究
古代至中世纪重量的研究
- 批准号:
02904041 - 财政年份:1990
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
02202112 - 财政年份:1990
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
L-functions via geometric quantization
通过几何量化的 L 函数
- 批准号:
2302346 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Continuing Grant
CAREER: Verified AI in Cyber-Physical Systems through Input Quantization
职业:通过输入量化验证网络物理系统中的人工智能
- 批准号:
2237229 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Continuing Grant
Symplectic groupoids and quantization of Poisson manifolds
辛群群和泊松流形的量化
- 批准号:
2303586 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Standard Grant
Physical Mathematics: String Theory, Quantization and Geometry
物理数学:弦理论、量化和几何
- 批准号:
SAPIN-2018-00029 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Subatomic Physics Envelope - Individual
Generalization and quantization of momentum maps to Lie algebroids
动量映射到李代数体的概括和量化
- 批准号:
22K03323 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Space-Time Quantization and Dark Matter
时空量子化和暗物质
- 批准号:
2207663 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Continuing Grant
FRG: Collaborative Research: Complex Lagrangians, Integrable Systems, and Quantization
FRG:协作研究:复杂拉格朗日量、可积系统和量化
- 批准号:
2152257 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Standard Grant
FRG: Collaborative Research: Complex Lagrangians, Integrable Systems, and Quantization
FRG:协作研究:复杂拉格朗日量、可积系统和量化
- 批准号:
2152107 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Standard Grant
Moduli and quantization of Poisson varieties
泊松簇的模和量化
- 批准号:
RGPIN-2020-05191 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Discovery Grants Program - Individual
Geometric quantization and metrics with special curvature properties
几何量化和具有特殊曲率特性的度量
- 批准号:
RGPIN-2020-04683 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Discovery Grants Program - Individual














{{item.name}}会员




