発声運動学習が音声認識学習に与える影響に関する計算言語学的研究

发声运动学习对语音识别学习影响的计算语言学研究

基本信息

  • 批准号:
    21K17805
  • 负责人:
  • 金额:
    $ 2.75万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
  • 财政年份:
    2021
  • 资助国家:
    日本
  • 起止时间:
    2021-04-01 至 2025-03-31
  • 项目状态:
    未结题

项目摘要

初年度、調音合成モデルを用いた教師なし音声認識学習の研究が難航した結果を踏まえ、2022年度は、全面人工ニューラルネットワーク実装による音声認識と音声合成の同時教師なし学習について、先行研究が抱える問題点の解決に焦点を置き、研究に取り組んだ。当初、教師あり音声合成を用いた研究を実施予定であったが、全面教師なし学習で同等の研究実施可能性の見込みが立ったため、計画を変更した。具体的には、教師なし学習で得られる離散的記号表現の、時間解像度および記号数の観点から見た簡略化に取り組み、特に時間解像度の圧縮については、先行研究の5分の2にまで圧縮できる見込みが立った。一方で、本研究課題用に昨年度購入した計算サーバに不具合が発生し、各種計算の実施に遅延した。不具合についての原因究明を、納品元と協力して進めているが、まだ解決しておらず、既に終了した別研究課題の計算資源を代替手段として利用し、研究を実施している状況である。発信面では、招待講演で本研究が取り組む教師なし音声認識を周知した他、教師なし音声認識技術を活用した動物音声研究を査読付き国際会議にて発表した。
Early year, tuning synthetic モ デ ル を with い た teachers な し sounds know が の research learning difficult navigation し た results を tread ま え, 2022 annual は, comprehensive artificial ニ ュ ー ラ ル ネ ッ ト ワ ー ク be loaded に よ る sounds know と voice synthesis の teachers at the same time な し learning に つ い て, leading research が え る を の solve に focus the problem point き, research group take り に ん だ . At the beginning, teachers あ を り voice synthesis with い た research を be giving constant で あ っ た が, comprehensive teacher な し study で equally の research be applied possibility の see 込 み が made っ た た め, plan を - more し た. Specific に は, teachers な で from し studying ら れ る discrete symbolizations の, time resolution お よ び mark number の 観 point か ら see た omens に take み り group, and briefly に time resolution の 圧 shrinkage に つ い て は, leading research の 5 points の 2 に ま で 圧 shrinkage で き る see 込 み が made っ た. One party で, the research topic uses the に purchased in the previous year for <s:1> た calculation サ バに バに バに does not have a が occurrence <s:1>, and various calculations <s:1> actual application に遅 delay た. Not close に つ い て の reason investigate を, na yuan Ming と together し て in め て い る が, ま だ solve し て お ら ず, both end し に た don't study の を instead of computing resources means と し て を し, studies on the be applied し て い る condition で あ る. 発 letter surface で は で host speaking, this study take り が group む teachers な し sounds know を known し た he, teachers な し sounds know technology を use し た animal sounds study を check 読 pay に き international conference て 発 table し た.

项目成果

期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
動物音声認識のための教師なし機械学習
用于动物语音识别的无监督机器学习
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kentaro Kanamori;Takuya Takagi;Ken Kobayashi;Yuichi Ike;Kento Uemura;Hiroki Arimura;森田尭;森田尭
  • 通讯作者:
    森田尭
Toward end-to-end unsupervised classification of animal vocalization
动物发声的端到端无监督分类
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森田尭;西村剛;森田尭;森田尭;Takashi Morita
  • 通讯作者:
    Takashi Morita
Analyzing and visualizing morphological features using machine learning techniques and non‐big data: A case study of macaque mandibles
  • DOI:
    10.1002/ajpa.24469
  • 发表时间:
    2022-01
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Takashi Morita;Tsuyoshi Ito;H. Koda;Hikaru Wakamori;Takeshi Nishimura
  • 通讯作者:
    Takashi Morita;Tsuyoshi Ito;H. Koda;Hikaru Wakamori;Takeshi Nishimura
CT画像と深層学習を用いた骨格標本上の形態学的変異の可視化と発見
使用 CT 图像和深度学习可视化和发现骨骼标本的形态变化
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kentaro Kanamori;Takuya Takagi;Ken Kobayashi;Yuichi Ike;Kento Uemura;Hiroki Arimura;森田尭
  • 通讯作者:
    森田尭
Towards Biological Discoveries through the Eyes of AI
通过人工智能的视角实现生物学发现
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    森田尭;西村剛;森田尭
  • 通讯作者:
    森田尭
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

森田 尭其他文献

森田 尭的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('森田 尭', 18)}}的其他基金

音声離散表現の超圧縮による教師なし音声言語学習の言語学的妥当性向上
通过超压缩离散语音表示提高无监督口语学习的语言有效性
  • 批准号:
    24K15087
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)

相似海外基金

脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
  • 批准号:
    23K20170
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
  • 批准号:
    24K04125
  • 财政年份:
    2024
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
CAREER: Statistically-Sound Knowledge Discovery from Data
职业:从数据中发现统计上合理的知识
  • 批准号:
    2238693
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Continuing Grant
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
  • 批准号:
    22KJ2898
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    22H01749
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
  • 批准号:
    22K12168
  • 财政年份:
    2022
  • 资助金额:
    $ 2.75万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了