多重解像度解析を用いた機械学習による音声強調および広帯域化に関する研究

使用多分辨率分析的机器学习语音增强和宽带化研究

基本信息

  • 批准号:
    22K12133
  • 负责人:
  • 金额:
    $ 2万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2022
  • 资助国家:
    日本
  • 起止时间:
    2022-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

狭帯域から広帯域への音声帯域拡張技術は音声としての人間らしさを強調するための手法である一方,音域のバランスを適応的に調整することで高齢になると感じる「聞こえづらさ」といった軽度の難聴問題を解消できる一助になると考えられる.本応募研究では,音声信号の多重解像度解析によって得られる階層型成分で得られる情報から,本来存在しない未知のサブバンド成分をサブバンド間の相関関係を用いて機械学習により推定することを目的に研究を遂行している.これについて,これまで本研究に係る自身の先行研究によって得られた成果をベースとして,どのようにしたら推定精度を向上させることができるか,ということを念頭に研究を進めており,まず,今年度の交付金を使用して新たな研究開発環境のハードウェア(高速なパーソナルコンピュータとGPGPUを搭載したグラフィックボード)とソフトウェア(MATLAB数値解析ソフト)の構築および整備を行った.つぎに,音声帯域拡張技術の実現手法の一つとして,連続音声データベースから音素単位に分解して子音または母音ごとの発声区間を判別し,それぞれの発声区間ごとにラベリング,つまりタグ付けを行う方法で研究を進めている.今後の研究の展開になるが,前述で得られた音素クラスタごとに多重解像度解析を用いた未知成分の推定パラメータを定義・決定し,より高品質な広帯域音声の獲得を目指す方針である.基本アプローチとしては離散ウェーブレット解析(DWT)を用いてDWT分解後のレベル間の相関を利用することで,機械学習を用いた相関係数の算出により,元来人間の肉声が持っていた高域成分および低域成分を疑似的に生成し,狭帯域の音声成分に付加することで広帯域化を図る予定である.
The sound of the narrow area is the sound of the narrow area. The らしさを emphasizes the するための technique and the である side, and the vocal range is のバランスを応的にadjustedすることで高齢になるとSenseじる「文こえづらさ」といった軽度の狠聴questionをsolvedできる一 Help になると考えられる. This research is based on the multi-resolution analysis of audio signals. The hierarchical component information is obtained. The original existence is unknown. Know the correlation between the components and components of the material, use the machine learning method to infer the purpose of the study, and carry out the research.これについて, これまで This research is based on my own pioneer research, によって has achieved られた results, をベースとして, どのようにしたら Estimated accuracy を させることができるか, ということを Thought に Research を Advance めており, まず, this year’s cross Pay a fee to use the new research and development environment of the new environment (high-speed GPGPU)したグラフィックボード)とソフトウェア(MATLAB numerical value analysis ソフト)のconstructed and maintained を行った.つぎに, sound band area stretching technology の実成technique の一つとして, even sound sound データベースからphoneme unit position に decomposition してconsonant またはvowel Discrimination between the sound interval of the soundリング, つまりタグ Pay けを行うmethod で Research を Advance めている. Future research will be carried out, and the use of the aforementioned multi-resolution analysis is unknown. Ingredients are presumed, defined and determined, and high-quality sound from the area is obtained. Basic DWT discrete data analysis (DWT) using DW After T decomposition, the correlation coefficient between the two is used, and the correlation coefficient is used for machine learning. Calculate により, Yuan Lai Renjian の肉声がhold っていたHigh domain component およびLow domain component をsuspiciousにGenerationし, the sound component of the narrow band area is added to the sound component, and the sound component is added to the narrow band area.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

林 誠治其他文献

Single Channel Speech Enhancement Based on Perceptual Frequency-weighting
基于感知频率加权的单通道语音增强
Speech Enhancement using Perceptual Frequency-weighting
使用感知频率加权的语音增强
聴覚スケーリング関数を用いた音声強調による雑音除去
使用听觉缩放功能通过语音增强消除噪声
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治;斎藤 泰明;植月龍興;垣實 洋;Seiji HAYASHI;Yasuaki SAITOH;Tatsuoki UETSUKI;Hiroshi KAKIMI;斉藤 泰明
  • 通讯作者:
    斉藤 泰明
音声スペクトルのピーク位置の補正を用いた雑音低減法の一考察
语音频谱峰值位置校正降噪方法的研究
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治;斎藤 泰明;植月龍興;垣實 洋;Seiji HAYASHI;Yasuaki SAITOH;Tatsuoki UETSUKI;Hiroshi KAKIMI;斉藤 泰明;植月龍興;垣實 洋;林 誠治;斉藤 泰明;斉藤 泰明;近藤 昌宏;吉田 貢;Seiji HAYASHI;Yasuaki SAITOH;Yasuaki SAITOH;Masahiro KONDO;Mitsugu YOSHIDA;林 誠治;斉藤 泰明;近藤 昌宏
  • 通讯作者:
    近藤 昌宏
A Study on Noise Suppression Approach Introducing Perceptual Scaling Function
引入感知尺度函数的噪声抑制方法研究
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T.Saito;H.Harada;T.Komatsu;齊藤隆弘;T.Saito;T.Komatsu;林 誠治;斎藤 泰明;植月龍興;垣實 洋;Seiji HAYASHI;Yasuaki SAITOH;Tatsuoki UETSUKI;Hiroshi KAKIMI;斉藤 泰明;植月龍興;垣實 洋;林 誠治;斉藤 泰明;斉藤 泰明;近藤 昌宏;吉田 貢;Seiji HAYASHI;Yasuaki SAITOH;Yasuaki SAITOH;Masahiro KONDO;Mitsugu YOSHIDA;林 誠治;斉藤 泰明;近藤 昌宏;Yasuaki SAITOH
  • 通讯作者:
    Yasuaki SAITOH

林 誠治的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

相似海外基金

多重解像度解析に基づく高階エネルギーの自動構築
基于多分辨率分析的高阶能量自动构建
  • 批准号:
    19K12052
  • 财政年份:
    2019
  • 资助金额:
    $ 2万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
多重解像度解析多重ウェーブレット基底による量子化学プログラム開発
多分辨率分析 使用多小波基础的量子化学程序开发
  • 批准号:
    19029019
  • 财政年份:
    2007
  • 资助金额:
    $ 2万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了