Modelling Speech Spectra Based on Logarithmic Shallow Neural Networks

基于对数浅层神经网络的语音谱建模

基本信息

  • 批准号:
    21K11957
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2024-03-31
  • 项目状态:
    已结题

项目摘要

本研究では,音声の表現に適した新しい機械学習手法として,確率的な浅層ニューラルネットである制限ボルツマンマシン(RBM)をベースに,対数振幅スペクトルと位相のデータ構造を適切に表現する音声技術を確立する.しばしばブラックボックスだと言われる深層学習モデルとは違い,RBMはデータの確率分布を陽に仮定できる解釈性がある.そのため,より適切に音声のデータ構造を表現することができる.初年度(令和3年度)は対数振幅スペクトルを表現することに主眼を置き,独自に提案したガンマRBMを用いた音声表現を確立させた.令和4年度では,このモデルを更に発展させ,対数振幅スペクトルに加えて位相を同時に表現するモデル(Gamma von-Mises RBM; GVM RBM)を新規提案し,実装,評価及び論文執筆を行なった.具体的には,可視素子として振幅スペクトル,対数振幅スペクトルおよび位相スペクトルを設定し,二値の隠れ素子が既知の可視素子の条件付き確率が,振幅スペクトルについてはガンマ分布,位相スペクトルについてはフォン・ミーゼス分布となり,更に両者が条件付き独立となることを示した.評価実験では,深層学習モデルやガンマRBMに位相復元を適応したモデルなどよりも飛躍的に高い精度で音声の符号化・復号化が可能であることを示した.本研究成果に関して,権威的な国際論文誌であるIEEE Signal Processing Letters(インパクトファクター:3.2)に1件投稿し,現在査読中である.
This study aims to establish a new mechanical learning technique for acoustic performance, and to establish an appropriate acoustic technique for acoustic performance based on numerical amplitude and phase structure. Deep learning is the key to RBM's accuracy distribution. The sound and structure of the sound are different. In the first year, the number of sound waves was increased. In the fourth year of this year, the new regulation proposal for Gamma Von-Mises RBM (GVM RBM) was proposed, and the new regulation proposal for Gamma Von-Mises RBM (GVM RBM) was carried out. Specifically, the visionaries are selected for amplitude, and the phase is selected for amplitude. Two values of the visionaries are selected for conditional accuracy of the known visionaries. The amplitude is selected for distribution. The phase is selected for distribution. More specifically, the conditional accuracy is selected for independence. Comments on deep learning RBM phase complex elements suitable for high precision sound symbolization complex sign possible The results of this research are relevant to the international journal of IEEE Signal Processing Letters (IEEE Signal Processing Letters: 3.2).

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Consistency Regularization for GAN-based Neural Vocoders
Gamma Boltzmann Machine for Audio Modeling
用于音频建模的伽马玻尔兹曼机
振幅重み付けエネルギー関数を用いたボルツマンマシンによる位相復元
玻尔兹曼机使用幅度加权能量函数进行相位恢复
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽賀洋克;矢田部浩平;岸田拓也;中鹿亘
  • 通讯作者:
    中鹿亘
話者因子係数の量子化に基づく声色制御可能な話者変換
基于说话人因子系数量化的语音可控说话人变换
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井硲巧;大西弘太郎;岸田拓也;中鹿亘
  • 通讯作者:
    中鹿亘
Non-parallel voice conversion based on free-energy minimization of speaker-conditional restricted boltzmann machine.
基于说话人条件限制玻尔兹曼机自由能最小化的非并行语音转换
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kishida;T.;& Nakashika;T.
  • 通讯作者:
    T.
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

中鹿 亘其他文献

Restricted Boltzmann Machine を用いた話者性・雑音を考慮したモデリングの検討
使用受限玻尔兹曼机考虑扬声器特性和噪声的建模研究
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高島 悠樹;中鹿 亘;滝口 哲也;有木 康雄
  • 通讯作者:
    有木 康雄
授業分析の原理に基づく参加型授業研究会
基于课程分析原则的参与式课程学习小组
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中鹿 亘;滝口 哲也;柴田好章・毛利隆宏
  • 通讯作者:
    柴田好章・毛利隆宏
構音障害者音声認識のための確率表現に基づく音素ラベリングの検討
基于概率表示的音素标注用于构音障碍语音识别的研究
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    高島 悠樹;中鹿 亘;滝口 哲也;有木 康雄
  • 通讯作者:
    有木 康雄
話者正規化学習に基づく潜在的音韻情報を考慮した音声モデリングによる非パラレル声質変換
基于说话人归一化学习的考虑潜在语音信息的语音建模的非并行语音质量转换
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中鹿 亘;滝口 哲也
  • 通讯作者:
    滝口 哲也
数値解析を利用した重心動揺の定量評価に関する研究
基于数值分析的重心晃动定量评估研究
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    塚本 伸;岸田 拓也;中鹿 亘;後藤 晶;木下 史也
  • 通讯作者:
    木下 史也

中鹿 亘的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('中鹿 亘', 18)}}的其他基金

非侵襲型脳波を用いた言語・非言語音声合成による次世代コミュニケーション技術の確立
通过使用非侵入性脑电波进行言语/非言语语音合成来建立下一代通信技术
  • 批准号:
    24H00715
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)

相似海外基金

肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
  • 批准号:
    24K15796
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
  • 批准号:
    24K13948
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
  • 批准号:
    24K13518
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
  • 批准号:
    24K15093
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
  • 批准号:
    24K15095
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
多次元イベント時間データ解析の推測理論と方法・機械学習の開発
多维事件时间数据分析的推理理论和方法/机器学习的发展
  • 批准号:
    24K14853
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
速度ポテンシャルエネルギー整形法と機械学習を用いた宇宙機制御理論の開発
利用速度势能整形方法和机器学习发展航天器控制理论
  • 批准号:
    23K20946
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
ユビキタス機械学習社会におけるプライバシ保護基盤
无处不在的机器学习社会中的隐私保护基础设施
  • 批准号:
    23K21695
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
正則化機能強化による超ロバスト推定法の開拓と一般化:信号処理・機械学習への応用
通过加强正则化功能开发和推广超鲁棒估计方法:在信号处理和机器学习中的应用
  • 批准号:
    23K22762
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
攻撃に耐性を持つ機械学習モデルによる設計工程ハードウェアトロイ検知
使用抗攻击的机器学习模型在设计过程中检测硬件木马
  • 批准号:
    23K24816
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了