Study on spoken language understanding framework integrating knowkedges among multiple layers

多层次知识融合的口语理解框架研究

基本信息

  • 批准号:
    21300066
  • 负责人:
  • 金额:
    $ 11.23万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    2009
  • 资助国家:
    日本
  • 起止时间:
    2009-04-01 至 2014-03-31
  • 项目状态:
    已结题

项目摘要

This study focuses on developing a framework that integrates handling of multiple knowledge layer from speech signal processing to spoken language understanding directly into speech recognition process in a statistical mannar. Statistical models at layers of language model, acoustic model and dialogue model are widely investigated. For integration, speech decoding based on Bayes-risk minimization in which all the constraint can be expressed as Bayes risk, and some integration methods that utilizes speech information for dialogue management and turn taking was investigated. Part of the results are publicly available as part of an open-source voice interaction building tool MMDAgent and Julius.
本研究的重点是开发一个框架,集成处理多个知识层从语音信号处理到口语理解直接到语音识别过程中的统计mannar。 语言模型、声学模型和对话模型等层次的统计模型得到了广泛的研究。 在语音融合方面,研究了基于贝叶斯风险最小化的语音解码方法,其中所有的约束条件都可以表示为贝叶斯风险,以及利用语音信息进行对话管理和话轮转换的语音融合方法。 部分结果作为开源语音交互构建工具MMDAgent和Julius的一部分公开提供。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Open answer scoring for S-CAT automated speaking test system using support vector regression
Detecting child speaker based on auditory feature vectors for VTL estimation
基于听觉特征向量检测儿童说话者进行 VTL 估计
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ryuichi Nisimura;Shoko Miyamori;Erika Okamoto;Hideki Kawahara;and Toshio Irino
  • 通讯作者:
    and Toshio Irino
音声入力型情報検索に対する単語信頼度によるリスコアリングを適用したベイズリスク最小化音声認識
贝叶斯风险最小化语音识别应用基于单词置信度的重新评分进行语音输入类型信息检索
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yuta Yasugahira;他2名;志々見 亮
  • 通讯作者:
    志々見 亮
講演発話を用いたN-gram補完手法の音声認識性能評価
使用讲座话语的 N-gram 补全方法的语音识别性能评估
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    吉田英一;金広文男;横井一仁;P. Gergondet;島田敏明
  • 通讯作者:
    島田敏明
音声入力型情報検索における単語重要度推定のための統計的機械翻訳を用いた音声認識シミュレート
使用统计机器翻译的语音识别模拟来估计语音输入类型信息检索中的单词重要性
  • DOI:
  • 发表时间:
    2010
  • 期刊:
  • 影响因子:
    0
  • 作者:
    七里崇;南條浩輝;吉見毅彦
  • 通讯作者:
    吉見毅彦
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

LEE Akinobu其他文献

LEE Akinobu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('LEE Akinobu', 18)}}的其他基金

A switch-free spoken language interface for real-world speech interface
用于现实世界语音界面的无开关口语界面
  • 批准号:
    18700118
  • 财政年份:
    2006
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

高機能自閉症者の音声言語理解における多感覚からのムード情報統合過程の神経基盤
高功能自闭症患者口语理解中多感觉情绪信息整合过程的神经基础
  • 批准号:
    20J21604
  • 财政年份:
    2020
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声言語理解の意味フイ-ドバックにおいて複数知識の統合制御のための学習メカニズム
口语理解语义反馈中多种知识集成控制的学习机制
  • 批准号:
    07221204
  • 财政年份:
    1995
  • 资助金额:
    $ 11.23万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了