タイミングに着目した協調的音声インタラクション分析とハンズフリー対話システム構築
协作语音交互分析,重点关注免提对话系统的计时和构建
基本信息
- 批准号:18049040
- 负责人:
- 金额:$ 1.86万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research on Priority Areas
- 财政年份:2006
- 资助国家:日本
- 起止时间:2006 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
人間と機械が対話を行うことを考えるとき,機械が人間同士の会話と同様にあいつちなどさまざまな応答を自然に返すことができれば,より円滑な対話を行うことが期待できる.本研究では,特に雑談のような対話に着目し,自然な雑談対話をする上で最も重要である応答タイミングと韻律的同調性の生成手法を提案した。さらにそれを用いて、種々の雑談的対話現象を生成できる対話システムの枠組みを提案し、それに基づく対話システムを試作した.まず、ユーザーシステム間の対話において、システムは時々刻々ユーザ発話の特徴から決定ルールを用いて相槌や話者交替の判断やそのタイミングを生成し、リアルタイムに応答する手法を実現した。これにより、オーバラップした相槌や話者交代、さらに相手の発話内容を予測してオーバラップして発話する「共同補完」などの、自然な対話で生起するさまざま雑談現象に対応できる手法となることを示した。タイミング生成や、発話内容の選択には、最後のユーザ発話の表層的言語情報及び韻律情報(ピッチやパワーの変化パターン)を情報源として用いた。さらに、対話はスムーズで盛り上がった場合には対話者間の韻律、特に声の高さが同期して変動していることを、実際の人間同士の対話の分析により確かめた。そして、それをシステムで実現するために、ユーザの韻律に追従する韻律制御モデルを提案して、その挙動が人間の動作に似たものであることを示した。この対話システムとの対話実験を行った結果、自然なタイミングでの相槌や話者交替、限定的な場面ではあるが同調発話を生成することが可能であることが示された。このような対話インタフェースを実際の場面で効果的に用いるためのハンズフリー音声認識に関して、数メートル程度の離れた環境で話者位置を推定し、それに応じた伝達特性補正を加える位置依存CMN法を提案・改良し、音声認識・話者認識性能の向上を果たした。
People-to-people machine talk, machine phone, machine, machine In this study, it is very important to pay close attention to the language, and naturally to answer the most important questions about the same generation method of the law. Do not use the language of the language, the language, the language. It is decided to use the gavel to alternately judge the generation of the equipment and the method of answering the phone. Let's talk, talk, The content of the conversation should be selected, and the final words and expressions of the conversation should be selected, and the source of the information should be used. In the event of negotiation and telephone communication, there is a high-level agreement between the two parties, a special voice, and a high-profile event. At the same time, it is necessary to make sure that it is safe and sound to make sure that it is done by the same person. The behavior of people involved in the negotiation of civil servants is similar to that of the people involved in the regulation of the legal system, the regulation of the legal system, and the human-to-human activities of the parties. The result of the conversation, the result of the conversation, the result of the In order to improve the performance of the CMN method, the location of the participants in the environment is presumed to be correct, and the location of the participants is positively dependent on the location.
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Longbiao Wang, Norihide Kitaoka, Seiichi Nakagawa."Robust Distant Speech Recognition by Combining Position-Dependent CMN with Conventional CMN
Longbiao Wang,Norihide Kitaoka,Seiichi Nakakawa。“通过将位置相关的 CMN 与传统 CMN 相结合实现鲁棒的远程语音识别
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Longbiao Wang;Norihide Kitaoka;Seiichi Nakagawa
- 通讯作者:Seiichi Nakagawa
Analysis of Effect of Compensation Parameter Estimation for CMN on Speech/Speaker Recognition
CMN补偿参数估计对语音/说话人识别的影响分析
- DOI:
- 发表时间:2007
- 期刊:
- 影响因子:0
- 作者:Longbiao Wang;Norihide Kitaoka;Seiichi Nakagawa
- 通讯作者:Seiichi Nakagawa
対話における韻律変化・タイミングの モデル化と音声対話システムへの適用
对话中韵律变化和时间的建模及其在口语对话系统中的应用
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:西村良太;北岡教英;中川聖一
- 通讯作者:中川聖一
Robust Distant Speech Recognition by Combining Multiple Microphone-array Processing with Position-dependent CMN
通过将多个麦克风阵列处理与位置相关的 CMN 相结合来实现鲁棒的远程语音识别
- DOI:
- 发表时间:2006
- 期刊:
- 影响因子:0
- 作者:Longbiao Wang;Norihide Kitaoka;Seiichi Nakagawa
- 通讯作者:Seiichi Nakagawa
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
北岡 教英其他文献
深層学習によるボトルネック特徴量を用いたマルチモーダル音声認識
使用深度学习使用瓶颈特征进行多模态语音识别
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
田村 哲嗣;二宮 宏史;北岡 教英;大須賀 晋;入部 百合絵;武田 一哉;速水 悟 - 通讯作者:
速水 悟
ROSを利用したリアルタイム制御が可能な音声対話システムの構築
利用ROS构建可实时控制的语音对话系统
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
西村 良太;森 貴大;北岡 教英 - 通讯作者:
北岡 教英
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲 - 通讯作者:
中村 哲
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0
- 作者:
中川 聖一;富樫 慎吾;山口 優;藤井 康寿;北岡 教英 - 通讯作者:
北岡 教英
北岡 教英的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('北岡 教英', 18)}}的其他基金
高齢者を対象とした永続的に利用できるマルチモーダル対話システム基盤技術の構築
建立老年人永久使用的多模态对话系统基础技术
- 批准号:
23H00493 - 财政年份:2023
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
人間の感覚と整合する音声特徴空間の構築
符合人类感官的音频特征空间构建
- 批准号:
22K19793 - 财政年份:2022
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
協調的音声対話の相槌・話者交替タイミング分析とそれに基づく応答生成法の研究
协作口语对话的合作/说话人变换时序分析及基于其的响应生成方法研究
- 批准号:
16016244 - 财政年份:2004
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声対話における誤り訂正発話の検出と頑健な対話システムの研究
口语对话中纠错话语的检测和鲁棒对话系统的研究
- 批准号:
16700173 - 财政年份:2004
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
ヒューマンフレンドリなマルチモーダル対話インタフェースを用いたWeb情報検索
使用人性化的多模式对话界面进行网络信息检索
- 批准号:
15017246 - 财政年份:2003
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
フォーム型Web情報サービス享受のためのマルチモーダル対話インタフェースの研究
享受基于表单的网络信息服务的多模态对话界面研究
- 批准号:
14019046 - 财政年份:2002
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
フォーム型Web情報サービス享受のためのマルチモーダル対話インタフェースの研究
享受基于表单的网络信息服务的多模态对话界面研究
- 批准号:
13224049 - 财政年份:2001
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas (C)
相似海外基金
パラ言語及び非言語的側面から見た日本語学習者のあいづちに関する研究
从副语言和非语言角度研究日语学习者的相土
- 批准号:
12780164 - 财政年份:2000
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
タスク指向日本語対話システムにおけるあいづちの理解と生成に関する研究
面向任务的日语对话系统中Aizuchi的理解与生成研究
- 批准号:
08780335 - 财政年份:1996
- 资助金额:
$ 1.86万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)