多重解像度解析を用いた機械学習による音声強調および広帯域化に関する研究
使用多分辨率分析的机器学习语音增强和宽带化研究
基本信息
- 批准号:22K12133
- 负责人:
- 金额:$ 2万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2022
- 资助国家:日本
- 起止时间:2022-04-01 至 2025-03-31
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
狭帯域から広帯域への音声帯域拡張技術は音声としての人間らしさを強調するための手法である一方,音域のバランスを適応的に調整することで高齢になると感じる「聞こえづらさ」といった軽度の難聴問題を解消できる一助になると考えられる.本応募研究では,音声信号の多重解像度解析によって得られる階層型成分で得られる情報から,本来存在しない未知のサブバンド成分をサブバンド間の相関関係を用いて機械学習により推定することを目的に研究を遂行している.これについて,これまで本研究に係る自身の先行研究によって得られた成果をベースとして,どのようにしたら推定精度を向上させることができるか,ということを念頭に研究を進めており,まず,今年度の交付金を使用して新たな研究開発環境のハードウェア(高速なパーソナルコンピュータとGPGPUを搭載したグラフィックボード)とソフトウェア(MATLAB数値解析ソフト)の構築および整備を行った.つぎに,音声帯域拡張技術の実現手法の一つとして,連続音声データベースから音素単位に分解して子音または母音ごとの発声区間を判別し,それぞれの発声区間ごとにラベリング,つまりタグ付けを行う方法で研究を進めている.今後の研究の展開になるが,前述で得られた音素クラスタごとに多重解像度解析を用いた未知成分の推定パラメータを定義・決定し,より高品質な広帯域音声の獲得を目指す方針である.基本アプローチとしては離散ウェーブレット解析(DWT)を用いてDWT分解後のレベル間の相関を利用することで,機械学習を用いた相関係数の算出により,元来人間の肉声が持っていた高域成分および低域成分を疑似的に生成し,狭帯域の音声成分に付加することで広帯域化を図る予定である.
Narrow band sound band expansion technology sound band sound band sound The purpose of this study is to obtain hierarchical components of acoustic signals by multiresolution analysis, and to obtain information about the correlation between the components of acoustic signals that are originally unknown, and to use machine learning to estimate the correlation between components of acoustic signals. This study is a preliminary study of our own. We have obtained the results of this study. We have estimated the accuracy of this study. This year's delivery of funds to use the new research development environment to build a better environment (high-speed software, GPGPU equipment) and software (MATLAB data analysis software) In this paper, the implementation method of sound band expansion technology is studied. The method of sound band expansion technology is studied. In the future, the research will be carried out in the following aspects: the definition and determination of unknown components in multi-resolution analysis, the acquisition of high-quality band-wide sound, and the policy of target selection. The basic theory of discrete time domain analysis (DWT) is used to calculate correlation coefficients after DWT decomposition. The acoustic components in the original elements are generated from high-domain components and suspected low-domain components. The acoustic components in the narrow domain are added to the domain.
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
林 誠治其他文献
Single Channel Speech Enhancement Based on Perceptual Frequency-weighting
基于感知频率加权的单通道语音增强
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治 - 通讯作者:
林 誠治
Speech Enhancement using Perceptual Frequency-weighting
使用感知频率加权的语音增强
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治;斎藤 泰明;植月龍興;垣實 洋;Seiji HAYASHI;Yasuaki SAITOH;Tatsuoki UETSUKI;Hiroshi KAKIMI;斉藤 泰明;植月龍興;垣實 洋;林 誠治 - 通讯作者:
林 誠治
聴覚スケーリング関数を用いた音声強調による雑音除去
使用听觉缩放功能通过语音增强消除噪声
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治;斎藤 泰明;植月龍興;垣實 洋;Seiji HAYASHI;Yasuaki SAITOH;Tatsuoki UETSUKI;Hiroshi KAKIMI;斉藤 泰明 - 通讯作者:
斉藤 泰明
音声スペクトルのピーク位置の補正を用いた雑音低減法の一考察
语音频谱峰值位置校正降噪方法的研究
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治;斎藤 泰明;植月龍興;垣實 洋;Seiji HAYASHI;Yasuaki SAITOH;Tatsuoki UETSUKI;Hiroshi KAKIMI;斉藤 泰明;植月龍興;垣實 洋;林 誠治;斉藤 泰明;斉藤 泰明;近藤 昌宏;吉田 貢;Seiji HAYASHI;Yasuaki SAITOH;Yasuaki SAITOH;Masahiro KONDO;Mitsugu YOSHIDA;林 誠治;斉藤 泰明;近藤 昌宏 - 通讯作者:
近藤 昌宏
A Study on Noise Suppression Approach Introducing Perceptual Scaling Function
引入感知尺度函数的噪声抑制方法研究
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治;斎藤 泰明;植月龍興;垣實 洋;Seiji HAYASHI;Yasuaki SAITOH;Tatsuoki UETSUKI;Hiroshi KAKIMI;斉藤 泰明;植月龍興;垣實 洋;林 誠治;斉藤 泰明;斉藤 泰明;近藤 昌宏;吉田 貢;Seiji HAYASHI;Yasuaki SAITOH;Yasuaki SAITOH;Masahiro KONDO;Mitsugu YOSHIDA;林 誠治;斉藤 泰明;近藤 昌宏;Yasuaki SAITOH - 通讯作者:
Yasuaki SAITOH
林 誠治的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似海外基金
多重解像度解析に基づく高階エネルギーの自動構築
基于多分辨率分析的高阶能量自动构建
- 批准号:
19K12052 - 财政年份:2019
- 资助金额:
$ 2万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Development of cancer detection system for lung CT that combines deep learning and multi-resolution analysis
开发结合深度学习和多分辨率分析的肺部CT癌症检测系统
- 批准号:
18K15641 - 财政年份:2018
- 资助金额:
$ 2万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Computing molecular properties with controlled precision using multi-resolution analysis
使用多分辨率分析以受控精度计算分子特性
- 批准号:
247396018 - 财政年份:2013
- 资助金额:
$ 2万 - 项目类别:
Research Grants
NetSE: Small: Multi-Resolution Analysis of Network Matrices
NetSE:小型:网络矩阵的多分辨率分析
- 批准号:
0916309 - 财政年份:2009
- 资助金额:
$ 2万 - 项目类别:
Standard Grant
NeTS: Small: Collaborative Research: Multi-Resolution Analysis & Measurement of Large-scale, Dynamic Networked Systems with Applications to Online Social Networks
NeTS:小型:协作研究:多分辨率分析
- 批准号:
0917381 - 财政年份:2009
- 资助金额:
$ 2万 - 项目类别:
Standard Grant
NetSE: Small: Collaborative Research: Multi-Resolution Analysis & Measurement of Large-scale, Dynamic Networked Systems with Applications to Online Social Networks
NetSE:小型:协作研究:多分辨率分析
- 批准号:
0916855 - 财政年份:2009
- 资助金额:
$ 2万 - 项目类别:
Standard Grant
多重解像度解析多重ウェーブレット基底による量子化学プログラム開発
多分辨率分析 使用多小波基础的量子化学程序开发
- 批准号:
19029019 - 财政年份:2007
- 资助金额:
$ 2万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
Wavelet Multi-resolution Analysis on Jet Issuing from Pipe with Rotating Inclined Section
旋转斜截面管道射流的小波多分辨率分析
- 批准号:
14550170 - 财政年份:2002
- 资助金额:
$ 2万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Multi-Resolution Analysis of Stochastic Processes
随机过程的多分辨率分析
- 批准号:
11650435 - 财政年份:1999
- 资助金额:
$ 2万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Sovable Models of Finite Multi-resolution analysis
有限多分辨率分析的可解模型
- 批准号:
09680362 - 财政年份:1997
- 资助金额:
$ 2万 - 项目类别:
Grant-in-Aid for Scientific Research (C)














{{item.name}}会员




