VOICE 2.0: towards augmentation of enriched speech communication

VOICE 2.0:增强丰富的语音通信

基本信息

  • 批准号:
    20KK0233
  • 负责人:
  • 金额:
    $ 11.98万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Fund for the Promotion of Joint International Research (Fostering Joint International Research (B))
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-10-27 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

本研究では,表現豊かな音声コミュニケーションを実現するために,音声の数理工学的な情報表現において,音声のエンリッチな情報を言語・非言語・パラ言語情報にそれぞれ分離し,それらを個別に制御することで,次の5点に関する音声エンリッチメント(VOICE 2.0)を実現する.課題① 言語情報におけるエンリッチメント,課題② 非言語情報(話者性)のエンリッチメント,課題③ 非言語情報(感情)のエンリッチメント,課題④ 非言語情報(声の質感)のエンリッチメント,課題⑤ パラ言語情報(緊迫感など)のエンリッチメント.本研究の期待するところは,音声の明瞭さや,感情,個人性,発話スタイルの変化といった声質をヒトのように高低・強弱の程度を制御して,音声コミュニケーションの付加価値を高めることにある.2022年度は,前年度課題で検討した課題②について継続して実施した.この課題では,音声の個人性と変調知覚の関係ならびに個人性と音声生成の関係を調査し,話者変換といったエンリッチメントを検討した.ここでは,話者の個人性情報を,McAdams係数を利用して制御することで話者秘匿化やプライバシー保護ができるか検討した.その結果,高い精度で秘匿可能であることを示した.次に課題③に取り組んだ.ここでは,音声の感情と変調知覚の関係を調査した.これまでに変調スペクトログラムの高次統計量を利用して感情知覚の関係を調べてきたが,すべての感情制御に共通する特徴(変調スペクトル尖度と変調スペクトル傾斜)があることを明らかにした.また,これらの特徴が雑音・残響に頑健であり,機械による感情音声認識にも有効であることも示した.最後に課題④に取り組んだ.ここでは,VoiceMOSチャレンジに参画し,音声の変調スペクトログラムに現れる特徴が音声の質評価に重要であることを明らかにした.
In this study, the performance of VOICE and digital engineering information performance, voice and digital information, speech, non-speech, speech information, separation, individual control, the next five points related to voice and digital engineering information performance. Subject 1: Verbal information; Subject 2: Non-verbal information (speaker); Subject 3: Non-verbal information (emotion); Subject 4: Non-verbal information (sound and texture); Subject 5: Verbal information (stress). This study is expected to be conducted in 2022 and 2023, and the previous year's topic will be discussed in 2022. The topic is to investigate the relationship between the individuality of sound and the generation of sound, and to investigate the relationship between the individuality and the generation of sound. The McAdams coefficient is used to control the privacy of the speaker. The result is high precision and hidden. Next topic ③ Select group. To investigate the relationship between sound and emotion. The high-order statistics of the emotional control system are used to analyze the relationship between emotional control system and emotional control system. The sound of the voice is strong, and the sound of the voice is strong. Finally, the topic ④ is selected. VoiceMOS is the most important feature of sound quality evaluation.

项目成果

期刊论文数量(96)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
音声に含まれる緊迫感の変調周波数帯域の検討
语音中包含的紧迫感的调制频带的检查
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Masayuki MATSUOKA;Hiroki YOSHIOKA;Kenta OBATA;Kazuhito ICHII;木谷俊介,劉小テイ,郭太陽,磯山拓都,李軍鋒,赤木正人,鵜木祐史
  • 通讯作者:
    木谷俊介,劉小テイ,郭太陽,磯山拓都,李軍鋒,赤木正人,鵜木祐史
Anomalous sound detection using objective metrics related to timbral attributes
使用与音色属性相关的客观指标进行异常声音检测
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yasuji Ota;Seigo Kura;Masashi Unoki
  • 通讯作者:
    Masashi Unoki
聴覚フィルタバンクを用いたラフネスモデルの構築
使用听觉滤波器组构建粗糙度模型
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    磯山 拓都;木谷 俊介;鵜木 祐史
  • 通讯作者:
    鵜木 祐史
緊迫感知覚に寄与する変調周波数帯域の検討
检查有助于紧迫感的调制频段
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    木谷 俊介;劉 小テイ;郭 太陽;磯山 拓都;李 軍鋒;赤木 正人;鵜木 祐史
  • 通讯作者:
    鵜木 祐史
Spectro-Temporal Modulationによる音声感情認識の調査
使用频谱时间调制的语音情感识别研究
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuning Liu;Di Zhou;Masashi Unoki;Jianwu Dang;Aijun Li;村上正悟,森田翔太
  • 通讯作者:
    村上正悟,森田翔太
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

鵜木 祐史其他文献

Internal logic viewed from observation space: Theory and a case study
从观察空间看内部逻辑:理论与案例研究
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama
  • 通讯作者:
    M. Hatakeyama
Controlling engine data : Nonperiodic fluctuations in a spark ignition engine of motorcycle and its stabilization
控制发动机数据:摩托车火花点火发动机的非周期性波动及其稳定性
脳の中のカオス
大脑混乱
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda;Y. Fukushima;伊藤孝男;Y.Yamaguti;K.Matsumoto;S.Tadokoro;津田一郎
  • 通讯作者:
    津田一郎
Chaos Reality in the Brain
大脑中的混沌现实
  • DOI:
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    羽二 生篤;鵜木 祐史;赤木 正人;M. Hatakeyama;Kazuhiro Matsumoto;I. Tsuda
  • 通讯作者:
    I. Tsuda
Speech signal processing based on the concept of modulation transfer function (1) Basis of power envelope inverse filtering and its applications
基于调制传递函数概念的语音信号处理(一)功率包络逆滤波的基础及其应用

鵜木 祐史的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('鵜木 祐史', 18)}}的其他基金

振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
  • 批准号:
    23K21679
  • 财政年份:
    2024
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Voice information-hiding/anonymization technology for voice privacy protection
语音信息隐藏/匿名化技术,保护语音隐私
  • 批准号:
    23K18491
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant
基于幅度调制感知的听觉丰富:人工耳蜗语音信号处理研究
  • 批准号:
    21H03463
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
蝸牛遅延特性を利用した音信号への情報ハイディング
利用耳蜗延迟特性将信息隐藏到声音信号中
  • 批准号:
    21650035
  • 财政年份:
    2009
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
変調伝達関数に基づいた骨導音声の明瞭度回復法の基礎検討
基于调制传递函数的骨导语音清晰度恢复方法基础研究
  • 批准号:
    17650048
  • 财政年份:
    2005
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Exploratory Research
雑音・残響環境下における基本周波数推定法に関する研究
噪声/混响环境下基频估计方法研究
  • 批准号:
    14780267
  • 财政年份:
    2002
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
聴覚的音分離の計算理論に関する研究
听觉声音分离计算理论研究
  • 批准号:
    00J04717
  • 财政年份:
    2000
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音の分離・抽出における聴覚の計算理論に関する基礎的研究
声音分离提取中的听觉计算理论基础研究
  • 批准号:
    98J08110
  • 财政年份:
    1998
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows

相似海外基金

振幅変調知覚に基づく聴覚エンリッチメント:人工内耳用音声信号処理の研究
基于调幅感知的听觉丰富:人工耳蜗音频信号处理研究
  • 批准号:
    23K21679
  • 财政年份:
    2024
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
環境エンリッチメントの脳ダイナミクスと行動学習障害の回復に関する基礎研究
环境丰富和行为学习障碍恢复的脑动力学基础研究
  • 批准号:
    23K10398
  • 财政年份:
    2023
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
老化制御機構の分子基盤解明に挑む~環境エンリッチメントとカロリー制限の観点から~
阐明衰老控制机制的分子基础——从环境富集和热量限制的角度——
  • 批准号:
    22K11727
  • 财政年份:
    2022
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
若齢期の食・運動習慣が骨格筋・褐色脂肪組織の老化関連遺伝子発現に及ぼす長期的効果
青年时期饮食和运动习惯对骨骼肌和棕色脂肪组织中衰老相关基因表达的长期影响
  • 批准号:
    22K11885
  • 财政年份:
    2022
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Molecular analysis of the effects of environmental factors on higher brain function using iPSC technology and mice
使用 iPSC 技术和小鼠对环境因素对高级脑​​功能的影响进行分子分析
  • 批准号:
    22K18655
  • 财政年份:
    2022
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
成体新生顆粒細胞の既存回路への組み込み制御を介したてんかん発症の抑制
通过控制成人肿瘤颗粒细胞整合到现有回路中抑制癫痫发作
  • 批准号:
    21J14150
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Elucidation of the pathophysiology of drug-induced depression and development of treatment methods using medical big data analysis
利用医学大数据分析阐明药物引起的抑郁症的病理生理学并开发治疗方法
  • 批准号:
    21K06646
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Auditory Enrichment based on perception of amplitude modulation: Study on speech signal processing for Cochlear Implant
基于幅度调制感知的听觉丰富:人工耳蜗语音信号处理研究
  • 批准号:
    21H03463
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
個人の支援行動における仕事外の要因とそのマネジメントに関する研究
个体助人行为中的额外工作因素及其管理研究
  • 批准号:
    21K01714
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
新生児脳症モデルの長期予後への低体温と成育環境の影響の時系列行動実験解析
低温和生长环境对新生儿脑病模型长期预后影响的时间序列行为实验分析
  • 批准号:
    21K11302
  • 财政年份:
    2021
  • 资助金额:
    $ 11.98万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了