構音障がい者のカスタマイズドコミュニケーション基盤技術の創出

为构音障碍人士打造定制化沟通平台技术

基本信息

  • 批准号:
    21H00906
  • 负责人:
  • 金额:
    $ 10.48万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

昨年度の研究成果をもとに構音障がい者のカスタマイズドコミュニケーション基盤技術に資する手法の提案,および実証実験をさまざまな観点から行い,それらの有効性を確認した.主な内容は以下のとおりである.(1) 器質性構音障がい者においては,発話器官の異常があるために,話者ごとに大きく異なる固有の発話スタイルを獲得していると考えられる.その結果,発音困難な音声と比較的容易な音声の間で,誤認識の頻度も大きく異なると考えられる.本年度では,その話者ごとの誤認識の傾向を考慮した発話辞書適応,および中間層損失関数を導入した音声認識システムを検討した.この音声認識システムでは話者ごとの誤り傾向を学びながらも,本来想定されている健常者と同じような認識結果を出力することが期待される.音声認識実験により認識精度が改善されることが示された.(2) 脊髄性筋萎縮症者の話者性を維持しつつ聞き取りやすい音声を合成するシステムの改良を行った.具体的には話者認識モデルから得られる話者埋め込みを利用して,新たな損失関数を深層学習に加える方法を提案した.その結果,提案法は収録音声と比較して明瞭で,従来法より話者性に優れた音声を生成することができた.また実環境下では人工呼吸器のような音を発する医療器具を装着された状態での収録が必要となることが多く,結果として機器雑音が混入した音声が収録されることとなる.それらの外部雑音を含む収録音声をそのまま学習に用いると,合成音声が雑音を多く含んだものになる可能性がある.そのため,本年度では,深層学習に基づく音声強調処理も音声合成システムの事前処理に組み込み,有効性を確認した.
Last year's research results were presented in the form of a proposal for a method for the development of a sound barrier, and the effectiveness of the method was confirmed. The main content is below. (1)Organic structure sound barrier is in the middle, abnormal speech organ is in the middle, speech organ is in the middle, speech organ As a result, it is difficult to hear the sound. It is easy to compare the sound. The frequency of misunderstanding is large. This year, the number of errors in the speech is considered. The voice recognition system is composed of the speaker's error tendency, the learner's error tendency, the speaker's error tendency, the learner's error tendency, and the speaker's error tendency. Sound recognition accuracy is improved. (2)The speech quality of patients with spinal muscular dystrophy is maintained. The concrete speaker recognizes the new speaker, and the new speaker uses the new speaker to learn the new speaker The result is that the proposed method is to compare the sound of the recording with the sound of the recording. In the case of artificial respiration, it is necessary to record the sound. For example, if the external sound contains the recorded sound, it may be possible to use the synthesized sound. This year's deep learning is based on sound emphasis processing and sound synthesis.

项目成果

期刊论文数量(45)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Adaptation of a Pronunciation Dictionary for Dysarthric Speech Recognition
個人ホームページ
个人主页
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
発話音声の感情を反映したテロップ画像の自動生成手法の検討
反映语音情感的字幕图像自动生成方法研究
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中村 史也;相原 龍;高島 遼一;滝口 哲也;今井 良枝
  • 通讯作者:
    今井 良枝
Harmonic-Net+:高調波入力とLayerwise-Quasi-Periodic畳み込みを用いた基本周波数制御可能な高速ニューラルボコーダ
Harmonic-Net+:使用谐波输入和分层准周期卷积进行基频控制的高速神经声码器
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松原 圭亮;岡本 拓磨;高島 遼一;滝口 哲也;戸田 智基;河井 恒
  • 通讯作者:
    河井 恒
知識グラフに基づく応答文生成におけるエンティティ名制約付きデコーディング
基于知识图谱的响应句生成中的实体名称约束解码
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐良和孝;滝口哲也;有木康雄
  • 通讯作者:
    有木康雄
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

滝口 哲也其他文献

Attention-based LSTMを用いた意図理解とキーワード抽出の統合による質問応答システム
使用基于注意力的 LSTM 集成意图理解和关键词提取的问答系统
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    松好祐紀;滝口 哲也;有木康雄
  • 通讯作者:
    有木康雄
ゲート制御付きSource-Target Attention を用いた複数知識文に基づく応答文の生成
使用带有门控制的源目标注意力基于多个知识句子生成响应句子
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    佐良 和孝;滝口 哲也;有木 康雄
  • 通讯作者:
    有木 康雄
徳島県阿南市の大理石産地の歴史と現状
德岛县阿南市大理石产地的历史与现状
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    澤 佑哉;高島 遼一;滝口 哲也;有木 康雄;乾 睦子
  • 通讯作者:
    乾 睦子
音声解析を用いた自閉スペクトラム症の単調なイントネーションの特徴.
使用语音分析的自闭症谱系障碍的单调语调特征。
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    中井 靖;滝口 哲也;藤堂 賀代;松井 学洋;高田 哲.
  • 通讯作者:
    高田 哲.
複数の矛盾する情報に関する協調的推論を促すCSCL の認識的足場かけに関する予備的評価
CSCL 认知支架的初步评估,以鼓励对多个矛盾信息进行协作推理
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    澤 佑哉;相原 龍;高島 遼一;滝口 哲也;今井 良枝;望月俊男,クラーク A. チン,ランディ M. ジマーマン,ミャッミンスェ,テイミンカウン,関根聖二
  • 通讯作者:
    望月俊男,クラーク A. チン,ランディ M. ジマーマン,ミャッミンスェ,テイミンカウン,関根聖二

滝口 哲也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('滝口 哲也', 18)}}的其他基金

構音障がい者のカスタマイズドコミュニケーション基盤技術の創出
为构音障碍人士创建定制化沟通平台技术
  • 批准号:
    23K20733
  • 财政年份:
    2024
  • 资助金额:
    $ 10.48万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
音声想起の脳波解析に基づく発話支援の基礎研究
基于语音回忆脑电波分析的语音支持基础研究
  • 批准号:
    22K18626
  • 财政年份:
    2022
  • 资助金额:
    $ 10.48万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了