音声対話における誤り訂正発話の検出と頑健な対話システムの研究

口语对话中纠错话语的检测和鲁棒对话系统的研究

基本信息

项目摘要

音声対話システムを利用する際には、システムは誤認識を起こす。誤認識したまま対話を継続して対話が破綻しないようにするためには誤認識を回復することが必要となるが、そのために、一般には確認発話を用いる。しかしこれは、対話の発話(ターン)数を増加し、効率の悪い対話となる。確認発話を行わない対話が破綻したり、最終的に誤った理解結果に至るのは、音声認識の結果の第一候補のみを信じて対話を進めるためである。各認識において、複数得られる認識候補を有効に用いれば、この危険は低減される。そこで、ユーザ発話の音声認識した結果得られる複数候補を利用し、各ターンごとにユーザ発話の理解候補を複数持つ、「あいまいな」理解状態表現を用い、この理解に基づいて対話を進めることのできる対話システムを開発した。複数の理解候補は、音声認識結果の信頼度によってスコア付けして保持され、この理解候補全体で理解状態を表現する。そして、ユーザの発話が認識され、あらたな複数認識候補が得られると、それらとの組み合わせによって新たな理解候補が複数生成され、理解状態が更新される。この過程で理解候補は組み合わせて的に増加していくため、スコアによる、いわゆる枝狩りによって上位候補に絞り込みながら対話を進める。その際、ユーザはシステム応答に応じた発話をするので、システムがいかに適切な応答をすることができるかは重要になる。そこで、現在の理解候補中からできるだけ正しいと考えられる候補に絞り込め(効率性)、かつ、その応答が対話履歴と照らした際にユーザにとって矛盾に感じる可能性が低い(無矛盾性)応答を選択する基準を対案した。この対話基準を、音声対話シミュレーション(擬似的な音声認識結果を生成する擬似認識器による擬似ユーザを用いた対話)により評価した結果、従来の、毎回確認する方法や、認識結果の信頼度が低い場合にのみ確認する方法と比較して少ないターン数で対話を完了できることを確認した。
The sound of the voice is used in the wrong way. Misunderstanding is not necessary. The number of incoming calls increased and the number of outgoing calls increased. Confirm that the first candidate for the second candidate for the first candidate for the first candidate for the second candidate for the first candidate for the first candidate for the second candidate for the first candidate for the first candidate for the second candidate for the first candidate for the second candidate for the first candidate for the first candidate for the second candidate for the first candidate for the second candidate for the second candidate for the first candidate for the second candidate for the second candidate for the first candidate for the second candidate for Each recognition is in the middle, the plural is in the middle, the danger is in the lower, the candidate is in the middle. The result of the voice recognition of the communication is that the multiple candidates are used, the multiple candidates are understood, the status of the communication is understood, the multiple candidates are used, and the multiple candidates are understood. A plurality of understanding candidates are represented by the degree of reliability of the sound recognition result. For example, if you want to know more, you can change your understanding status. This process is understood by the candidate group, and the candidate group. In the meantime, it is important for the system to respond to the problem. The probability of the candidate's response is low (no contradiction). The candidate's response is based on the criterion of the candidate's response. For example, if the user is not satisfied with the result of the evaluation, he/she may not be able to confirm the result of the evaluation.

项目成果

期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
誤認識の修復のための自然で効率的な 音声対話戦略
自然高效的语音交互策略,纠正错误识别
音声対話システムの誤認識に対するユーザの繰り返し訂正発話の検出と認識
针对语音对话系统的误识别,检测和识别用户重复的纠正性话语
誤認識の修復機能を備えた音声対話システムの構築
具有误识别纠正功能的语音对话系统的构建
Correction Utterance Detection Method for spoken Dialog Systems
口语对话系统的校正话语检测方法
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

北岡 教英其他文献

深層学習によるボトルネック特徴量を用いたマルチモーダル音声認識
使用深度学习使用瓶颈特征进行多模态语音识别
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    田村 哲嗣;二宮 宏史;北岡 教英;大須賀 晋;入部 百合絵;武田 一哉;速水 悟
  • 通讯作者:
    速水 悟
ROSを利用したリアルタイム制御が可能な音声対話システムの構築
利用ROS构建可实时控制的语音对话系统
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西村 良太;森 貴大;北岡 教英
  • 通讯作者:
    北岡 教英
残響下音声認識評価基盤(CENSREC-4)の構築
混响语音识别评估平台(CENSREC-4)的构建
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0
  • 作者:
    西浦 敬信;中山 雅人;傳田 遊亀;北岡 教英;山本 一公;山田 武志;藤本 雅清;柘植 覚;宮島 千代美;滝口 哲也;田村 哲嗣;小川 哲司;松田 繁樹;黒岩 眞吾;武田 一哉;中村 哲
  • 通讯作者:
    中村 哲
講義音声ドキュメンのコンテンツ化と視聴システム
讲座音频文档内容创建及查看系统
音声言語情報に基づいた認知症高齢者の判別
基于口语信息区分老年痴呆症
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    梅澤 舞菜;入部 百合絵;北岡 教英
  • 通讯作者:
    北岡 教英

北岡 教英的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('北岡 教英', 18)}}的其他基金

高齢者を対象とした永続的に利用できるマルチモーダル対話システム基盤技術の構築
建立老年人永久使用的多模态对话系统基础技术
  • 批准号:
    23H00493
  • 财政年份:
    2023
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
人間の感覚と整合する音声特徴空間の構築
符合人类感官的音频特征空间构建
  • 批准号:
    22K19793
  • 财政年份:
    2022
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Challenging Research (Exploratory)
タイミングに着目した協調的音声インタラクション分析とハンズフリー対話システム構築
协作语音交互分析,重点关注免提对话系统的计时和构建
  • 批准号:
    18049040
  • 财政年份:
    2006
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
協調的音声対話の相槌・話者交替タイミング分析とそれに基づく応答生成法の研究
协作口语对话的合作/说话人变换时序分析及基于其的响应生成方法研究
  • 批准号:
    16016244
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ヒューマンフレンドリなマルチモーダル対話インタフェースを用いたWeb情報検索
使用人性化的多模式对话界面进行网络信息检索
  • 批准号:
    15017246
  • 财政年份:
    2003
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
フォーム型Web情報サービス享受のためのマルチモーダル対話インタフェースの研究
享受基于表单的网络信息服务的多模态对话界面研究
  • 批准号:
    14019046
  • 财政年份:
    2002
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
フォーム型Web情報サービス享受のためのマルチモーダル対話インタフェースの研究
享受基于表单的网络信息服务的多模态对话界面研究
  • 批准号:
    13224049
  • 财政年份:
    2001
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)

相似海外基金

非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
酵素の基質誤認識を誘起するペプチドの創製
创建诱导酶底物错误识别的肽
  • 批准号:
    20J23653
  • 财政年份:
    2020
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
金融危機時における銀行バランスシートリスクと貸出行動の誤認識問題
金融危机期间银行资产负债表风险和贷款行为的误解
  • 批准号:
    18K01693
  • 财政年份:
    2018
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Development of misunderstanding-prevention learning program that works on metacognition and fosters skills for flexible interpretation of others' intention
开发预防误解的学习计划,致力于元认知并培养灵活解释他人意图的技能
  • 批准号:
    18K02899
  • 财政年份:
    2018
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
天然基質の官能基の一部として誤認識される小分子を用いた酵素の誤作動と酵素反応制御
使用被错误识别为天然底物官能团一部分的小分子进行酶故障和酶反应控制
  • 批准号:
    16J02846
  • 财政年份:
    2016
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Are models for the origins of agriculture in southwest Asia based on a misunderstanding of the relationship between wild and domesticated wheat?
西南亚农业起源模型是否基于对野生小麦和驯化小麦之间关系的误解?
  • 批准号:
    NE/M010805/1
  • 财政年份:
    2015
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Research Grant
The Study for the improvement of communication between parents and childcare workers learning from misunderstanding examples
改善家长与保育员之间沟通的研究,从误解的例子中学习
  • 批准号:
    26381112
  • 财政年份:
    2014
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
A study of misunderstanding: with special reference to pseudo-common Japanese expressions
误解研究:特别提及伪常用日语表达
  • 批准号:
    23520517
  • 财政年份:
    2011
  • 资助金额:
    $ 2.11万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Understanding and Misunderstanding Across Cultures
跨文化的理解与误解
  • 批准号:
    6928780
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
Understanding and Misunderstanding Across Cultures
跨文化的理解与误解
  • 批准号:
    7225970
  • 财政年份:
    2004
  • 资助金额:
    $ 2.11万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了