音声情報圧縮の基礎研究:言語音のスペクトル変化と発声器官の動きとの同時観測

语音信息压缩基础研究:同时观察语音频谱变化和发声器官的运动

基本信息

  • 批准号:
    16J05172
  • 负责人:
  • 金额:
    $ 1.22万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
  • 财政年份:
    2016
  • 资助国家:
    日本
  • 起止时间:
    2016-04-22 至 2018-03-31
  • 项目状态:
    已结题

项目摘要

平成28年度に行った9名の英語母語話者による聴取実験のデータ分析を行った。英語音声において、臨界帯域ごとのパワーの時間変動情報が圧縮されたとき、言語内容をどれだけ明瞭に知覚できるかを確かめることが目的であった。英語音声は因子分析によって数個の因子の時間変動に情報圧縮した。圧縮された情報から元のパワーの時間変動を再構成し、雑音駆動音声として再合成した。因子数が2個まででは実験参加者はほとんど言語内容を聴き取ることができなかったが、因子数が3個以上から少しずつ内容が聴きとれるようになり、8個以上用いたところで、単語正答率が80%を超えることが分かった。日本語と同様に、英語においても3因子以上から音声の内容が理解され始めるということが示された。平成28年度までの研究で、約500~1500 Hzの周波数帯域に高い因子負荷量をもつ因子は音声知覚において特に重要であると分かった。この因子は、音韻論の分野で提唱されている音素の鳴音性と強い相関があると先行研究で示されている。鳴音性の因子が現れていない2因子からなる因子、鳴音性の因子が現れている3または4因子からなる因子のそれぞれから2因子以上を用いて雑音駆動音声を再合成し聴取実験を行った。鳴音性の因子が与える情報を持たない音声の明瞭度は低く、また因子数が2個ではどのような条件でも明瞭度は低かった。よって、雑音駆動音声の明瞭な知覚には鳴音性の情報と3つ以上の因子の情報が必要であると分かった。
In the year of Pingcheng, 9 English-speaking mothers were selected for analysis. English audio communication, communication, communication and communication. English acoustical factor analysis was used to analyze several factors in time-related emotional analysis. Do not change the time of the motion to reorganize the sound, the sound. The number of factors of the participants in the two-month training program, the content of the participants, the content of the participants, the number of factors, the number of participants, the number of factors, the number of participants, the number of factors, the number of participants, the number of factors, the number of participants, the number of factors, the number of participants, the number of participants, the number of In Japan, the content of sound is more than 3 factors, and the content of sound is understood. Pingcheng 28 annual research, about 500,1500 Hz cycle number domain, "high factor", "sound, etc." On the basis of the factors and phonemes, the phonemes are strongly correlated with each other, and the advance research shows that the phonemes are different. The sound quality factor, the sound quality factor, the tone factor, the sound factor, the tone factor, the tone factor, the tone There are two factors, one is the low level of understanding, the other is the number of factors, and the other is the low degree of understanding. It is clear that it is necessary for you to know that you are aware of the factors of emotion, emotion and emotion.

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Phonology and psychophysics: Is sonority real?
音韵学和心理物理学:声音真实吗?
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nakajima;T.;Ueda;K.;Remijn;G. B.;Yamashita;Y.;& Kishida;T.
  • 通讯作者:
    T.
臨界帯域パワー変動から抽出された非負基底の音声再合成における妥当性
语音再合成中临界带功率波动提取非负基的有效性
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中尾貫志;岸田拓也;中島祥好;亀岡弘和
  • 通讯作者:
    亀岡弘和
Intelligibility of English noise-vocoded speech resynthesized from spectral-change factors.
从频谱变化因素重新合成的英语噪声声码语音的清晰度。
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kishida;T.;Nakajima;Y.;Ueda;K.;Remijn G. B.;Arndt;S.;& Elliott;M. A.
  • 通讯作者:
    M. A.
Effects of factor elimination on intelligibility of noise-vocoded Japanese speech.
因素消除对噪声声码日语语音清晰度的影响。
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kishida;T.;Nakajima;Y.;Ueda;K.;& Remijn;G.B.
  • 通讯作者:
    G.B.
臨界帯域パワー変動因子を用いた雑音駆動音声の合成:因子の除去が明瞭度に与える効果
使用临界频带功率变化因子合成噪声驱动的语音:因子去除对清晰度的影响
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岸田 拓也;中島祥好;上田 和夫;Gerard B Remijn;中尾 貫志
  • 通讯作者:
    中尾 貫志
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

岸田 拓也其他文献

41037 CFDを用いた常時換気される床暖房室内温熱環境の評価法に関する研究(設備等と室内環境, 環境工学II)
41037 基于CFD的持续通风地暖房间热环境评价方法研究(设备等与室内环境,环境工程II)
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    大島 協子;高橋 誠;倉渕 隆;岩本 靜男;近藤 武士;遠藤 智行;岸田 拓也
  • 通讯作者:
    岸田 拓也
Mechanically Robust but Readily Repairable Polymeric Materials
机械坚固且易于修复的聚合物材料
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    岸田 拓也;中島祥好;上田 和夫;Gerard B. Remijn;中尾 貫志;相田 卓三
  • 通讯作者:
    相田 卓三
数値解析を利用した重心動揺の定量評価に関する研究
基于数值分析的重心晃动定量评估研究
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    塚本 伸;岸田 拓也;中鹿 亘;後藤 晶;木下 史也
  • 通讯作者:
    木下 史也
適応型 RBM を用いたノンパラレル感情音声変換
使用自适应 RBM 的非并行情感语音转换
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    塚本 伸;岸田 拓也;中鹿 亘
  • 通讯作者:
    中鹿 亘
社会経済的要因が利他性・不平等回避性・信頼に与える影響:クラウドソーシングを用いたオンラインサーベイ実験による考察
社会经济因素对利他主义、避免不平等和信任的影响:一项利用众包进行在线调查实验的研究
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    塚本 伸;岸田 拓也;中鹿 亘;後藤 晶
  • 通讯作者:
    後藤 晶

岸田 拓也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('岸田 拓也', 18)}}的其他基金

深層エネルギーベースモデルによる創造的声質変換の研究
使用深度能量模型进行创造性语音质量转换的研究
  • 批准号:
    23K11161
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

インターネットデータの活用によるテキスト音声合成の感情表現力向上
利用互联网数据提高文本语音合成的情感表现力
  • 批准号:
    24KJ0860
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
  • 批准号:
    23K21945
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
顔画像から声を再現するクロスモーダルボイスクローニング音声合成技術の研究
从面部图像再现声音的跨模态克隆语音合成技术研究
  • 批准号:
    24K02959
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非侵襲型脳波を用いた言語・非言語音声合成による次世代コミュニケーション技術の確立
通过使用非侵入性脑电波进行言语/非言语语音合成来建立下一代通信技术
  • 批准号:
    24H00715
  • 财政年份:
    2024
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Singing voice synthesis that can form ensemble with humans and computers
人机合奏的歌声合成
  • 批准号:
    23K18474
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
話者・地域・スタイルモーフィング音声合成による実環境リスニング学習支援
使用说话者/区域/风格变形语音合成来支持真实世界的听力学习
  • 批准号:
    22H00673
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
eスポーツ理解に向けた実況解説音声の分析及び音声合成アルゴリズムの開発
分析现场解说音频并开发理解电子竞技的语音合成算法
  • 批准号:
    22K17945
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
複数の調音運動データを中間情報とするマルチモーダル音声合成
使用多个发音运动数据作为中间信息的多模态语音合成
  • 批准号:
    22K12100
  • 财政年份:
    2022
  • 资助金额:
    $ 1.22万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了