複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
基本信息
- 批准号:13224057
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas (C)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
会議・会話など人間どうしの音声を対象として、音声データの収集を行うとともに、その音響的・言語的そしてコミュニケーションの観点からのモデル化を行った。まず会議音声を対象として、階層的なアーカイブを構築し、議事録の作成支援を行うシステムを設計した。GMMによる話者識別を行い、その結果により音声を分割するとともに、話者IDや時間情報などのインデックスを生成する。また談話標識を含むキーフレーズの検出により議論の結論となる発話を特定し、議事次第や会議の配布資料などに含まれる話題依存語彙を利用して、これを自動的に書き起こし、議事録のドラフトとする。以上により音声・インデックス・テキストの3層からなるアーカイブを構築することができる。次に、この談話標識に基づく自動インデキシングを大規模な講演音声コーパスに対して適用・評価を行った。学習データの講演の書き起こしからポーズ情報を用いてセクション境界候補を検出し、統計的言語モデルを用いて句点を挿入して、各セクションの先頭の一文を抽出する。その中に含まれる名詞から単語頻度と文頻度に基づいて談話標識を選定する。これらの過程は人手によるタグを必要としない教師なし学習により行われる。評価データの各文について談話標識の単語頻度と文頻度の統計量に基づく評価値を計算し、その合計が閾値以上であればインデックスを付与する。実際の講演音声の書き起こしと音声認識結果に対して評価を行った結果、再現率85%程度(適合率は20%程度)の精度で話題セクション境界を自動検出することができた。
The conference, the conversation, the sound, the collection, the sound, the speech, the conversation, the The voice of the meeting is related to the structure of the meeting, the creation of the meeting record, and the design of the meeting record. GMM: Speaker identification, voice segmentation, speaker ID, and time information generation Conversation identification includes the identification of topics, the identification of conclusions, the identification of topics, and the identification of topics. The third floor of the building is constructed by the sound and sound. Second, the speech logo is automatically displayed on a large scale. The first part of the speech is about the selection of candidates, the selection of statistics, and the selection of the first part of the speech In the middle of the sentence, the noun, the word frequency, the word frequency, the word base, and the word mark are selected. The process of teaching is necessary for teachers to learn For each text of the evaluation data, the basic evaluation value is calculated based on the single word frequency of the conversation logo and the statistics of the text frequency. If the total value exceeds the threshold value, the evaluation data will be paid. When the speech sound is written, the sound recognition result is evaluated, the reproduction rate is 85%(the suitability rate is 20%), the topic state is automatically detected, and the sound recognition result is evaluated.
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
M.Mimura: "Difference of acoustic modeling for read speech and dialogue speech"Acoustical Science & Technology. 22. 373-374 (2001)
M.Mimura:“朗读语音和对话语音的声学建模的差异”声学科学
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
K.Komatani: "Domain-independent spoken dialogue platform using key-phrase spotting based on combined language model"Proc.EUROSPEECH. 1319-1322 (2001)
K.Komatani:“使用基于组合语言模型的关键短语识别的领域独立口语对话平台”Proc.EUROSPEECH。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
長谷川将宏: "談話標識の抽出に基づいた講演音声の自動インデキシング"情報処理学会研究報告. SLP-36-6. (2001)
Masahiro Hasekawa:“基于话语标记提取的讲座音频自动索引”日本信息处理学会研究报告(2001)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
T.Kawahara: "Automatic transcription of spontaneous lecture speech"IEEE workshop Automatic Speech Recognition and Understanding. (2001)
T.Kawahara:“自发演讲演讲的自动转录”IEEE 研讨会自动语音识别和理解。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
河原 達也其他文献
京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
駒谷 和範;河原 達也;奥乃 博 - 通讯作者:
奥乃 博
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也 - 通讯作者:
河原 達也
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也 - 通讯作者:
三井隆也
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久 - 通讯作者:
川端大輔,木村朝子,柴田史久
河原 達也的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('河原 達也', 18)}}的其他基金
End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
- 批准号:
20H00602 - 财政年份:2020
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
- 批准号:
15F15049 - 财政年份:2015
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
強化学習に基づく適応的な音声対話システム
基于强化学习的自适应口语对话系统
- 批准号:
10F00050 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
- 批准号:
10F00361 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
- 批准号:
19024044 - 财政年份:2007
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
- 批准号:
18049047 - 财政年份:2006
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
- 批准号:
16016250 - 财政年份:2004
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
- 批准号:
15017252 - 财政年份:2003
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
- 批准号:
14019052 - 财政年份:2002
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
キーフレーズ認識とその信頼度計算に基づく柔軟な音声対話理解
基于关键词识别的灵活语音对话理解及其可靠性计算
- 批准号:
09780328 - 财政年份:1997
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
- 批准号:
24K10630 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
23K23017 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
- 批准号:
23K20170 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
- 批准号:
24K06231 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
- 批准号:
24K04125 - 财政年份:2024
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
- 批准号:
22KJ2898 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
- 批准号:
23K16944 - 财政年份:2023
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
- 批准号:
22H01749 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
- 批准号:
22K12168 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
- 批准号:
22K10459 - 财政年份:2022
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)