权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

発声運動学習が音声認識学習に与える影響に関する計算言語学的研究

发声运动学习对语音识别学习影响的计算语言学研究

基本信息

批准号：
21K17805
负责人：
森田尭
金额：
$ 2.75万
依托单位：
Osaka University
依托单位国家：
日本
项目类别：
Grant-in-Aid for Early-Career Scientists
财政年份：
2021
资助国家：
日本
起止时间：
2021-04-01 至 2025-03-31
项目状态：
未结题

项目摘要

初年度、調音合成モデルを用いた教師なし音声認識学習の研究が難航した結果を踏まえ、2022年度は、全面人工ニューラルネットワーク実装による音声認識と音声合成の同時教師なし学習について、先行研究が抱える問題点の解決に焦点を置き、研究に取り組んだ。当初、教師あり音声合成を用いた研究を実施予定であったが、全面教師なし学習で同等の研究実施可能性の見込みが立ったため、計画を変更した。具体的には、教師なし学習で得られる離散的記号表現の、時間解像度および記号数の観点から見た簡略化に取り組み、特に時間解像度の圧縮については、先行研究の5分の2にまで圧縮できる見込みが立った。一方で、本研究課題用に昨年度購入した計算サーバに不具合が発生し、各種計算の実施に遅延した。不具合についての原因究明を、納品元と協力して進めているが、まだ解決しておらず、既に終了した別研究課題の計算資源を代替手段として利用し、研究を実施している状況である。発信面では、招待講演で本研究が取り組む教師なし音声認識を周知した他、教師なし音声認識技術を活用した動物音声研究を査読付き国際会議にて発表した。

Early year, tuning synthetic モデルを with いた teachers なし sounds know がの research learning difficult navigation した results を tread まえ, 2022 annual は, comprehensive artificial ニューラルネットワーク be loaded による sounds know と voice synthesis の teachers at the same time なし learning について, leading research がえるをの solve に focus the problem point き, research group take りにんだ . At the beginning, teachers あをり voice synthesis with いた research を be giving constant であったが, comprehensive teacher なし study で equally の research be applied possibility の see 込みが made ったため, plan を - more した. Specific には, teachers なで from し studying られる discrete symbolizations の, time resolution および mark number の観 point から see た omens に take みり group, and briefly に time resolution の圧 shrinkage については, leading research の 5 points の 2 にまで圧 shrinkage できる see 込みが made った. One party で, the research topic uses the に purchased in the previous year for <s:1> た calculation サバにバにバに does not have a が occurrence <s:1>, and various calculations <s:1> actual application に遅 delay た. Not close についての reason investigate を, na yuan Ming と together して in めているが, まだ solve しておらず, both end しにた don't study のを instead of computing resources means としてをし, studies on the be applied している condition である. 発 letter surface ではで host speaking, this study take りが group む teachers なし sounds know を known した he, teachers なし sounds know technology を use した animal sounds study を check 読 pay にき international conference て発 table した.