オンライン講義の学びを活性化するソーシャルアノテーションに基づく講義要約システム
基于社交标注的讲座摘要系统,盘活在线讲座学习
基本信息
- 批准号:21K13641
- 负责人:
- 金额:$ 3万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Early-Career Scientists
- 财政年份:2021
- 资助国家:日本
- 起止时间:2021-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究では、オンライン講義の動画やライブ配信に付与された学生のリアクション(投稿コメントや「いいね」など)と、講師の作成した講義コンテンツ(講義スライドやレジュメなど)を学習データに活用することで、講義音声の音声認識(自動書き起こし)と自動要約(重要な部分の自動抽出)を高精度化することを目指している。2022年度は、以下の研究内容を実施した。【内容1】本研究の対象とする講義音声のような自由発話では、特定の原稿などを読み上げる朗読音声とは異なり、フィラーや言い淀みをはじめとする非流暢的音響特徴が音声認識における誤認識の原因となる。こうした話し言葉特有の問題をEnd-to-End型の音声認識で考慮するために、非流暢ラベルを用いる手法を昨年度に提案した。今年度は、大規模言語モデルBERT(Bidirectional Encoder Representations from Transformers)のfine-tuningに基づいて、非流暢ラベルを含まない書き言葉のテキストデータに対し、非流暢ラベルを疑似的に挿入する手法を提案した。これにより、書籍などの書き言葉のテキストデータを、講義音声などの自由発話の音声認識モデルの学習に効果的に利用することが可能となる。学術講演を対象とした評価実験により、提案手法の有効性を示した。【内容2】本研究の対象とする講義音声では、専門性の高い発話内容が多く含まれることから、専門分野特有の言い回しや専門用語などを高精度に認識できることが重要である。このような場合には、音声認識モデルの学習において獲得される音響情報と言語情報のうち、特に言語情報を効果的に利用する手法が必要となる。今年度は、このための方法として昨年度に提案した Density Ratio Approach に基づく認識手法が、日本語の音声においても有効であることを評価実験によって示した。
This study aims to improve the accuracy of the animation of handouts, the distribution of information, the preparation of handouts, the use of handouts, and the automatic offer of handouts. In 2022, the following research contents were implemented. [Contents 1] This study focuses on the non-smooth acoustic characteristics and the causes of misrecognition of sound in the free speech, the specific manuscript, the speech, the sound, the difference, the speech, and the sound. The problem of End-to-End sound recognition is considered, and the method of non-smooth sound recognition is proposed. This year, we propose fine-tuning, non-smooth encoding techniques for large-scale speech coding BERT (Bidirectional Encoder Representatives from Transformers), including the use of speech coding techniques for non-smooth encoding. This is a book, a book, a book Academic lectures, comments, proposals and methods [Content 2] The content of this study is mainly related to the sound of the lecture, the high level of the speech, the high level of the speech. In this case, it is necessary to acquire sound information, speech information and special speech information for learning and using them. This year's proposal is based on the Density Ratio Approach, which is used to evaluate Japanese pronunciation.
项目成果
期刊论文数量(15)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
言い淀みラベル付けによる非流暢発話のEnd-to-End音声認識
使用犹豫标记对不流畅语音进行端到端语音识别
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Yoshimitsu Miyazawa;Maomi Ueno;森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英;宮澤芳光,植野真臣;堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英;宮澤 芳光,植野 真臣;森大輝,太田健吾,西村良太,小川厚徳,北岡教英;堀井こはる,福田芽衣子,太田健吾,西村良太,北岡教英
- 通讯作者:堀井こはる,福田芽衣子,太田健吾,西村良太,北岡教英
Advanced language model fusion method for encoder-decoder model in Japanese speech
日语语音编码器-解码器模型的高级语言模型融合方法
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Daiki Mori;Kengo Ohta;Ryota Nishimura;Atsunori Ogawa;Norihide Kitaoka
- 通讯作者:Norihide Kitaoka
言い淀みを考慮した自由発話のEnd-to-End音声認識
考虑犹豫的自由言论的端到端语音识别
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Koharu Horii;Meiko Fukuda;Kengo Ohta;Ryota Nishimura;Atsunori Ogawa;Norihide Kitaoka;森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英;堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
- 通讯作者:堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英
End-to-end音声認識モデルにおける暗黙的言語情報の置換法
端到端语音识别模型中的隐式语言信息替换方法
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Yoshimitsu Miyazawa;Maomi Ueno;森 大輝,太田 健吾,西村 良太,小川 厚徳,北岡 教英;宮澤芳光,植野真臣;堀井 こはる,福田 芽衣子,太田 健吾,西村 良太,北岡 教英;宮澤 芳光,植野 真臣;森大輝,太田健吾,西村良太,小川厚徳,北岡教英
- 通讯作者:森大輝,太田健吾,西村良太,小川厚徳,北岡教英
自発的発話認識のためのBERTによる非流暢文生成に基づく言語モデリング
使用 BERT 进行自发语音识别的基于非流利句子生成的语言建模
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Tsunomori Y;Higashinaka R;Yoshimura T;Yoshinori;堀井 こはる,太田 健吾,西村 良太,小川 厚徳,北岡 教英
- 通讯作者:堀井 こはる,太田 健吾,西村 良太,小川 厚徳,北岡 教英
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
太田 健吾其他文献
背景差分と色の差異を利用した人物の追跡
利用背景差异和颜色差异跟踪人员
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
浅沼 健一;奥本 剛史;横田 悠一;前田 忠彦;久野 綾子;鄭 哲成;通山 和裕;坂本 憲昭;榎堀 優;森川 知憲;馬谷 達也;太田 健吾 - 通讯作者:
太田 健吾
Multimodal dialog with photorealistic CG agent
具有真实感 CG 代理的多模式对话
- DOI:
10.20697/jasj.78.5_257 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
北岡 教英;西村 良太;太田 健吾 - 通讯作者:
太田 健吾
カタクチイワシの体サイズ・産卵経験に伴う繁殖投資戦略
根据凤尾鱼体型和产卵经验制定养殖投资策略
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
米田 道夫;片山知史;河野 悌昌;山本昌幸;長谷川 淳;津崎 龍雄;山田 徹生;太田 健吾 - 通讯作者:
太田 健吾
太田 健吾的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('太田 健吾', 18)}}的其他基金
教育効果を考慮した大規模音声言語モデルに基づく教材生成AIの構築
考虑教育效果的基于大规模口语模型的教材生成人工智能构建
- 批准号:
24K06322 - 财政年份:2024
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
自然な発話による音声インタラクションのための言語モデルに関する研究
利用自然语音进行语音交互的语言模型研究
- 批准号:
11J07766 - 财政年份:2011
- 资助金额:
$ 3万 - 项目类别:
Grant-in-Aid for JSPS Fellows