HMnetを用いたLSP係数の極低ビットレート符号化法の開発
使用HMnet开发LSP系数的极低比特率编码方法
基本信息
- 批准号:17760293
- 负责人:
- 金额:$ 2.18万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Young Scientists (B)
- 财政年份:2005
- 资助国家:日本
- 起止时间:2005 至 2006
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
携帯電話やIP電話等,音声を圧縮・伝送する場合,音声データはLSP係数に変換して伝送される。LSP係数を効率よく圧縮できれば,極低ビットレートで高品質に音声を伝送することが可能となるため,従来より様々な圧縮符号化法が提案されてきた。その中で,セグメント量子化法は時間方向の類似性をよく表現できるため,効率よく符号化することが可能である。この時,LSP係数の時系列をどうやってセグメントに切りわけるか,が性能を大きく左右する重要なポイントである。そこで本研究では,ML-BEATS法(Maximum Likelihood Boundary Estimation Algorithm for Time-Sequence)を提案し,これを用いてLSP係数を効率的に符号化する方法を開発した。まず,以前音響モデル学習用に提案したASP-HMnet作成アルゴリズムをベースに,一般の時系列デーをセグメントに分割し,同時にHMnetでモデル化する方法を提案した。この方法(ML-BEATS法)は,尤度最大基準をもとにセグメント分割を行うため,入力された系列全体に対して最適なセグメントを獲得することができる。更にML-BEATS法を用いてLSP係数を符号化する方法を提案した。この方法でLSP係数の符号化実験を行ったところ,12bit/frameでケプストラム歪が1.64dB程度という結果が得られた。この数字は標準化されている方法のひとつであるG.729(18bit/frame,1.2dB)と比較すると,ビットレートは低いが歪も大きい,という結果であった。そこで更なる歪の低減を目指し,各次元独立に符号化する方法を提案した。LSP係数はもともと低次側から1次元目,2次元目,…としているため,低次側の係数が縮退(や分離)をすると,以降の次元がずれる,という現象が起きてしまう。そこで,LSP係数の各次元を別々に扱い,それぞれ1次元の時系列としてML-BEATS法を適用した。この時,すべての次元を1つのHMnetを用いてモテル化することで,次元がずれた場合にも対処できるようにした。この方法を用いてLSP係数の符号化実験を行ったところ,23bit/frameで1.1dBと,ケプストラム歪を下げることには成功したが,その時のビットレートが従来法に比べて高いものとなってしまった。この原因は,各次元を独立に扱ったため,各次元間の相関を利用していないので比縮効率が下がってしまったためと思われる。
With や 帯 phone IP telephones, voice を 圧 suo · 伝 send す る occasions, sounds デ ー タ は LSP coefficients に variations in し て 伝 send さ れ る. Rate of LSP coefficients を sharper よ く 圧 shrinkage で き れ ば, extremely low ビ ッ ト レ ー ト で high-quality に sounds を 伝 send す る こ と が may と な る た め, 従 to よ り others 々 な 圧 shrinkage symbolic method proposed が さ れ て き た. そ の で, セ グ メ ン ト quantization method は time direction の similarity を よ く performance で き る た め, sharper rate よ く symbolic す る こ と が may で あ る. こ の, LSP coefficient の series を ど う や っ て セ グ メ ン ト に cut り わ け る か, が performance を big き く around す る important な ポ イ ン ト で あ る. そ こ で this study で は, ML - BEATS method (Maximum Likelihood Boundary Estimation Algorithm for Time - Sequence) を proposal し, こ れ を with い て LSP coefficients を sharper rate に symbolic す る method を open 発 し た. ま ず, before sound モ デ ル learning with に proposal し た ASP - HMnet made ア ル ゴ リ ズ ム を ベ ー ス に, when general の series デ ー を セ グ メ ン ト に し segmentation, at the same time に HMnet で モ デ ル change す る method proposed を し た. こ の method (ML - BEATS) は, especially degree biggest benchmark を も と に セ グ メ ン ト line segmentation を う た め, into force さ れ た series all に し seaborne て optimum な セ グ メ ン ト を get す る こ と が で き る. The にML-BEATS method を uses the を てLSP coefficient を symbolization する method を proposal た た. こ の way で LSP coefficients の symbolic be 験 を line っ た と こ ろ, 12 bit/frame で ケ プ ス ト ラ ム slanting が degree of 1.64 dB と い う results ら が れ た. こ の digital は standardized さ れ て い る method の ひ と つ で あ る g. 729 (18 bit/frame, 1.2 dB) と compare す る と, ビ ッ ト レ ー ト は low い が slanting も big き い, と い う results で あ っ た. Youdaoplaceholder0 する で is more なる slightly reduced by を points, each dimension independent に symbolization する method を proposal た た. LSP coefficients と と と lower-order side ら ら 1-dimensional order, 2-dimensional order,... と し て い る た め, low coefficient of lateral の が retreat (や separation) を す る と, with の dimensional が ず れ る, と い う phenomenon since が き て し ま う. そ こ で, coefficient of LSP の all yuan を don't 々 に Cha い, そ れ ぞ れ series when one yuan の と し て ML - BEATS を applicable し た. When こ の す べ て の dimensional を 1 つ の HMnet を with い て モ テ ル change す る こ と で, dimensional が ず れ た occasions に も 処 seaborne で き る よ う に し た. こ の way を with い て LSP coefficients の symbolic be 験 を line っ た と こ ろ, 23 bit/frame で 1.1 dB と ケ プ ス ト ラ ム slanting を under げ る こ と に は successful し た が, そ の when の ビ ッ ト レ ー ト が に 従 to method than べ て high い も の と な っ て し ま っ た. は こ の reasons, every yuan を independent に Cha っ た た め, all の phase between yuan masato を using し て い な い の で が than under the shrinkage rate of unseen が っ て し ま っ た た め と think わ れ る.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ML-BEATS法を用いたLSP係数の極低ビットレート符号化法の検討
基于ML-BEATS方法的LSP系数极低码率编码方法研究
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:鈴木基之
- 通讯作者:鈴木基之
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
鈴木 基之其他文献
Spotify音楽データを用いたユーザの感情に基づく音楽推薦手法の提案
利用Spotify音乐数据提出基于用户情感的音乐推荐方法
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Yukonhiatou Chaxiong;Yoshihisa Tomoki;Kawakami Tomoya;Teranishi Yuuichi;Shimojo Shinji;撫佐昭裕;鈴木 基之;鈴木基之;曽田円香,志風美雨,辻愛美紗,中野美由紀 - 通讯作者:
曽田円香,志風美雨,辻愛美紗,中野美由紀
鈴木 基之的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('鈴木 基之', 18)}}的其他基金
HPV関連中咽頭癌の前癌病変の同定と自然史の解明に基づくバイオマーカーの探索
基于癌前病变的识别和 HPV 相关口咽癌自然史的阐明来寻找生物标志物
- 批准号:
24K12671 - 财政年份:2024
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of a mutual conversion method between face image and voice during speech
语音时人脸图像与声音相互转换方法的开发
- 批准号:
22K12916 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
離散型HMnetを用いた音声認識システム用言語モデルの自動獲得手法の開発
基于离散HMnet的语音识别系统自动语言模型获取方法的开发
- 批准号:
11780244 - 财政年份:1999
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
環境汚染物質の人体影響評価のための簡易模擬人体システムの開発に関する基礎研究
开发简单人体系统评估环境污染物对人体影响的基础研究
- 批准号:
08878072 - 财政年份:1996
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Exploratory Research
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
08358022 - 财政年份:1996
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
ゼロエミッションをめざした物質循環プロセスの構築
构建以零排放为目标的物质循环流程
- 批准号:
07355015 - 财政年份:1995
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Co-operative Research (B)
人間-環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
04202114 - 财政年份:1993
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
03202115 - 财政年份:1991
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
古代〜中世の錘の研究
古代至中世纪重量的研究
- 批准号:
02904041 - 财政年份:1990
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (B)
人間ー環境系の変化と制御・総合班
人类-环境系统变化与控制/综合团队
- 批准号:
02202112 - 财政年份:1990
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
相似海外基金
L-functions via geometric quantization
通过几何量化的 L 函数
- 批准号:
2302346 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Continuing Grant
CAREER: Verified AI in Cyber-Physical Systems through Input Quantization
职业:通过输入量化验证网络物理系统中的人工智能
- 批准号:
2237229 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Continuing Grant
Symplectic groupoids and quantization of Poisson manifolds
辛群群和泊松流形的量化
- 批准号:
2303586 - 财政年份:2023
- 资助金额:
$ 2.18万 - 项目类别:
Standard Grant
Physical Mathematics: String Theory, Quantization and Geometry
物理数学:弦理论、量化和几何
- 批准号:
SAPIN-2018-00029 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Subatomic Physics Envelope - Individual
Generalization and quantization of momentum maps to Lie algebroids
动量映射到李代数体的概括和量化
- 批准号:
22K03323 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Space-Time Quantization and Dark Matter
时空量子化和暗物质
- 批准号:
2207663 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Continuing Grant
FRG: Collaborative Research: Complex Lagrangians, Integrable Systems, and Quantization
FRG:协作研究:复杂拉格朗日量、可积系统和量化
- 批准号:
2152257 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Standard Grant
Moduli and quantization of Poisson varieties
泊松簇的模和量化
- 批准号:
RGPIN-2020-05191 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Discovery Grants Program - Individual
FRG: Collaborative Research: Complex Lagrangians, Integrable Systems, and Quantization
FRG:协作研究:复杂拉格朗日量、可积系统和量化
- 批准号:
2152107 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Standard Grant
Geometric quantization and metrics with special curvature properties
几何量化和具有特殊曲率特性的度量
- 批准号:
RGPIN-2020-04683 - 财政年份:2022
- 资助金额:
$ 2.18万 - 项目类别:
Discovery Grants Program - Individual














{{item.name}}会员




