Infrastructural spoken language technology to support smooth communication with hearing-impaired people in education

基础口语技术支持教育中听力障碍人士的顺利沟通

基本信息

  • 批准号:
    20H01716
  • 负责人:
  • 金额:
    $ 11.56万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2020
  • 资助国家:
    日本
  • 起止时间:
    2020-04-01 至 2023-03-31
  • 项目状态:
    已结题

项目摘要

本研究では,聴覚障害者の音声認識性能改善が主たる目的である.したがって,障害者からの音声データの収集およびコーパス作成が重要となる.しかしながら,前年度より引き続くCOVID-19による緊急事態宣言の影響により,対面による学生の音声収録は予定よりも遅れることとなった(当初予定40名のところ15名).ただし,収録内容はATR音素バランス文503文を中心として,話者一人当たりおおむね600から700文章を収集した.年度後半より,収録参加者(学生)および実施責任者がオンラインコミュニケーションに習熟したことにより,数名に対してオンライン下での音声収録を試みた.圧縮音声およびPCM音声の両者を収録するシステムを構築し,次年度以降の効率的なデータ収集への対応を可能とした.一方,聴覚障害者の音声データの蓄積が進んだことにより,前年度に引き続きend-to-end音声認識による実験を通して,聴覚障害者に共通する音素レベルでの音声認識の誤り傾向の調査を行った.分析の結果,子音/z/, /ts/, /ch/等の一部の誤りについては,他の聴覚障害者の音声データを学習データに追加することにより,おおむね10%程度の誤り削減が可能であることがわかった.このことから,聴覚障害者の調音運動の特徴には一定の共通因子が存在し,十分な量のデータが集積されれば頑健な音声認識が可能だとの結論を得た.聴覚障害者の音声データ量は本年度の研究においても不十分であったことから,健聴者の音声を利用して,聴覚障害者向け音声認識で用いる際のニューラルネットワークの基本構造の検討を行った.本研究の開始以来,視覚・聴覚障害である盲ろう者に対する情報保障のニーズの高まりを受けたことから,対象を音声点訳としたうえでend-to-endアプローチ(conformer/transformer)による性能の調査を行った.
This study aims to improve the acoustic performance of the victims. It's important to create a sound system that's harmful to the environment. In the previous year, there were 15 students who were originally scheduled to attend the COVID-19 Emergency Declaration. The content of the recording is ATR phoneme 503 articles, the center of the recording is ATR phoneme 600 articles, and the speaker is ATR phoneme 700 articles. In the second half of the year, the participants (students) and the responsible persons of the recording will be familiar with the sound recording. The next year, we will reduce the efficiency of the PCM audio system. On the other hand, the accumulation of sound quality of the victims has been improved. In the previous year, the end-to-end sound recognition was introduced. The investigation of the common sound quality of the victims was carried out. The analysis results show that some errors in the sub-sound/z/, /ts/, /ch/, etc. are added to the learning error, and the error is reduced to a degree of 10%. A conclusion is drawn that there are certain common factors in the characteristics of the tuning motion of the impaired. This year's research on the sound quality of the impaired is conducted in the context of the sound utilization of the impaired. Since the beginning of this study, the investigation of end-to-end performance has been carried out in the field of visual and acoustic protection.

项目成果

期刊论文数量(22)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ExKaldi-RT: A Real-Time Automatic Speech Recognition Extension Toolkit of Kaldi
Advanced language model fusion method for encoder-decoder model in Japanese speech
日语语音编码器-解码器模型的高级语言模型融合方法
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daiki Mori;Kengo Ohta;Ryota Nishimura;Atsunori Ogawa;Norihide Kitaoka
  • 通讯作者:
    Norihide Kitaoka
End-To-End Speech to Braille Translation in Japanese
日语盲文翻译的端到端语音翻译
言い淀みを考慮した自由発話のEnd-to-End音声認識
考虑犹豫的自由言论的端到端语音识别
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Koharu Horii;Meiko Fukuda;Kengo Ohta;Ryota Nishimura;Atsunori Ogawa;Norihide Kitaoka;森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英;堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
  • 通讯作者:
    堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
加齢性難聴に伴うポピュラーソングの印象変化の検討~模擬難聴を用いて
检查由于年龄相关的听力损失而导致的流行歌曲印象的变化 - 使用模拟听力损失
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    寺澤洋子;水野真由美;山本 雄也;大中 悠生;石川 嘉秀;松井淑恵;安啓一
  • 通讯作者:
    安啓一
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

小林 彰夫其他文献

Simultaneous Speech Subtitling Systems for Multiple Speakers
多发言者同步语音字幕系统

小林 彰夫的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('小林 彰夫', 18)}}的其他基金

オンライン環境における健聴者・聴覚障害者間の意思疎通を支援する音声言語基盤技術
支持正常听力者与听力障碍者在网络环境中进行交流的口语平台技术
  • 批准号:
    23K25692
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Spoken Language Technology for Online Communication Between Normal-Hearing and Hearing-Impaired People
听力正常者与听力障碍者在线交流的口语技术
  • 批准号:
    23H00995
  • 财政年份:
    2023
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
食品フレーバー分析におけるGC-MSデータベースの構築
食品风味分析GC-MS数据库的构建
  • 批准号:
    60860013
  • 财政年份:
    1985
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research
甲殻類の焙焼香気
烤甲壳类的香气
  • 批准号:
    59580049
  • 财政年份:
    1984
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
アミノ・カルボニル反応による食品加熱香気の形成
氨基羰基反应形成食品加热香气
  • 批准号:
    58560123
  • 财政年份:
    1983
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
生理活性を有する天然ポリアセチレン類の合成
生物活性天然聚乙炔的合成
  • 批准号:
    X00095----266052
  • 财政年份:
    1977
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (D)
植物生長抑制物質の検索と合成研究
植物生长抑制剂的检索及合成研究
  • 批准号:
    X00090----756057
  • 财政年份:
    1972
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
天然殺虫成分の合成化学的研究
天然杀虫成分的合成化学研究
  • 批准号:
    X44095-----86537
  • 财政年份:
    1969
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (D)

相似海外基金

聴覚障害幼児に対する「読み聞かせ」の指導スキル確立に関する実証的研究
建立听障儿童朗读教学技能的实证研究
  • 批准号:
    23K20718
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
聴覚障害者の鑑賞環境向上のための人材育成プログラムおよび導入マニュアルの開発
制定人力资源开发计划和介绍手册,以改善听力障碍者的观看环境
  • 批准号:
    24K03577
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
聴覚障害児の物語文理解における推論生成と「心の理論」の関連性
听障儿童叙事理解中推理生成与“心理理论”的关系
  • 批准号:
    24H02465
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Encouragement of Scientists
聴覚障害学生のセルフ・アドボカシー向上のための日本手話習得支援に関する研究
日本手语习得支持以提高听障学生自我宣传能力的研究
  • 批准号:
    24K06163
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
健聴児ならびに聴覚障害児の数学的コミュニケーションの認知-非認知能力の測定
测量听力和听力障碍儿童的数学交流的认知和非认知能力
  • 批准号:
    23K20191
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
聴覚障害乳幼児と教員のコミュニケーション行動の発達心理学的研究
听障婴儿与教师沟通行为的发展心理学研究。
  • 批准号:
    24K16723
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
疫学×計算×基礎を融合したシクロデキストリン含有医薬品の聴覚障害の評価
结合流行病学、计算和基础知识评价含环糊精药物的听力损伤
  • 批准号:
    24K09941
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
定量的構造活性相関モデルを活用したシスプラチン腎障害・聴覚障害の新規予防薬の探索
利用定量结构-活性关系模型寻找顺铂肾损伤和听力损伤的新预防药物
  • 批准号:
    24K09958
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
聴覚障害児の読解に視覚的情報はどれだけ有効か:図が文章理解に与える効果の検討
视觉信息对听障儿童的阅读理解有多有效:检查图片对文本理解的影响
  • 批准号:
    24K06190
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
聴覚障害児のための英語の発話明瞭度に関する尺度の作成と効果測定
听障儿童英语言语清晰度量表的编制及有效性测量
  • 批准号:
    24K06188
  • 财政年份:
    2024
  • 资助金额:
    $ 11.56万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了