フレーズのスポッティングに基づく頑健な会話音声理解

基于短语识别的强大会话语音理解

基本信息

  • 批准号:
    08780349
  • 负责人:
  • 金额:
    $ 0.64万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
  • 财政年份:
    1996
  • 资助国家:
    日本
  • 起止时间:
    1996 至 无数据
  • 项目状态:
    已结题

项目摘要

頑健な音声認識を実現するためには、理解に重要な部分を抽出(スポッティング)して、それを基に意味表現を形成していく方式が有望である。従来の単語を単位とするスポッティングでは、マッチングのテンプレートが小さく、また構文的な知識を基本的に利用しないので、局所的な類似性やノイズの影響を受けやすく、結果として誤った単語候補が多数生成された。そこで本研究では、単語ではなく、フレーズのスポッティングに基づくアプローチを研究した。フレーズは、"今日から"や"午後3時に"などのように、単語の組合せ(フレーズ文法)で構成され、意味表現の要素になる単位である。本アプローチは、(1)単語連鎖、(2)フレーズ構文、(3)フレーズ間制約の順に、徐々に強い制約を適用していく段階的探索戦略に基づいており、各段階の処理は、前段階の結果をヒューリスティックとするA^*探索として実現した。フレーズをスポッティングの単位とすることにより、単語スポッティングに比較してかなり高い抽出率を得た。本スポッティングアルゴリズムは,best-first探索であるので、フレーズ候補を正しくスコア順に得ることができる。さらに、このスポッティングに基づく文認識・理解のためのA^*探索アルゴリズムを、ラティスパージングとトレリスパージングの両方について考案した。最適な探索戦略を実現することで、認識精度を低下させることなく、非定型発話に対する頑健性を実現した。
The sound recognition is realized, the important part of understanding is extracted, the basic meaning is formed, and the way is expected. The basic knowledge of the structure of the text is used in the process of the similarity of the text, and the result is that the majority of the candidates for the single language are generated. This study is based on the study of the relationship between the two countries.フレーズは、"今日から"や"午后3时に"などのように、単语の组合せ(フレーズ语法)で构成され、意味表现の要素になる単位である。This article discusses the following: (1) Single language linkage;(2) Single language structure;(3) Single language constraint;(4) Single language constraint;(5) Single language constraint;(6) Single language constraint;(7) Single language constraint;(8) Single language constraint;(9) Single language constraint;(9) Single language constraint;(10) Single language linkage;(11) Single language linkage;(12) Single language linkage;(13) Single language linkage;(14) Single language linkage;(15) Single language linkage;(16) Single language linkage;(15) Single language linkage;(16) Single language linkage;(17) Single language linkage;(18) Single language linkage;(19) Single language linkage;(19) Single language linkage;(10) Single language The number of entries in the list of entries is zero. This is the best way to find out what's going on. In addition to the above, the author also discusses the basic knowledge and understanding of the problem. The optimal exploration strategy is realized, the cognitive accuracy is reduced, and the robustness of the non-stereotyped communication is realized.

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" 電子情報通信学会技術研究報告. SP96-86. (1996)
T.Kawahara:“灵活语音理解的关键短语检测和验证”IEICE 技术研究报告(1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Kawahara: "Key-phrase detection and verification for flexible speech understanding" Proc.Int'1 Conf.on Spoken Language Processing. 2. 681-684 (1996)
T.Kawahara:“灵活语音理解的关键短语检测和验证”Proc.Int1 Conf.on 口语语言处理。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
T.Kawahara: "Comcept-based phrase spotting approach for spontaneous speech understanding" Proc.IEEE Int'1 Conf.Acoust.,Speech & Signal Process. 1. 291-294 (1996)
T.Kawahara:“用于自发语音理解的基于概念的短语识别方法”Proc.IEEE Int1 Conf.Acoust.,演讲
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
李晃伸: "A^*探索に基づく大語彙連続音声認識" 情報処理学会研究報告. 96-SLP-11-4. (1996)
李皇进:“基于A^*搜索的大词汇量连续语音识别”日本信息处理学会研究报告96-SLP-11-4。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
河原達也: "A^*探索に基づいたフレーズスポッティングによる頑健な音声理解" 電子情報通信学会論文誌. J79-DII. 1187-1194 (1996)
Tatsuya Kawahara:“基于 A^* 搜索的短语识别的鲁棒语音理解”,电子、信息和通信工程师学会汇刊 J79-1194 (1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

河原 達也其他文献

京都市バス運行情報案内システムにおける実ユーザのふるまいの分析
京都市公交车运营信息引导系统的实际用户行为分析
多様な相槌をうつ傾聴対話システムのための相槌形態の予測
支持多种宜人内容的听力对话系统的宜人形式预测
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    山口 貴史;井上 昂治;吉野 幸一郎;高梨 克也;Nigel G. Ward;河原 達也
  • 通讯作者:
    河原 達也
音声対話システムにおけるユーザのふるまいの経時的変化の分析
分析语音对话系统中用户行为随时间的变化
モバイルMRシステム構築のための機能分散型フレームワーク(8)-アニメーションの表現力向上-
构建移动MR系统的功能分布式框架(8)-提高动画表现力-
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    平山 高嗣;角 康之;河原 達也;松山隆司;加藤芳秀,松原茂樹;川端大輔,木村朝子,柴田史久
  • 通讯作者:
    川端大輔,木村朝子,柴田史久
原子核をプローブとした地球核周辺の局所構造探査
使用原子核作为探测器探索地核周围的局部结构
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    坂東 宜昭;糸山 克寿;昆陽 雅司;田所 諭;中臺 一博;吉井 和佳;河原 達也;奥乃 博;三井隆也
  • 通讯作者:
    三井隆也

河原 達也的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('河原 達也', 18)}}的其他基金

End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
  • 批准号:
    20H00602
  • 财政年份:
    2020
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
仮想空間のチームスポーツを介したコミュニケーションスキルの知的学習支援
通过虚拟空间中的团队运动来智能学习支持沟通技巧
  • 批准号:
    15F15049
  • 财政年份:
    2015
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
強化学習に基づく適応的な音声対話システム
基于强化学习的自适应口语对话系统
  • 批准号:
    10F00050
  • 财政年份:
    2010
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
用例に基づく対話制御を用いたコンピュータ支援型言語学習システム
使用基于示例的对话控制的计算机辅助语言学习系统
  • 批准号:
    10F00361
  • 财政年份:
    2010
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    19024044
  • 财政年份:
    2007
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
ユーザ・状況に適応的な音声対話による大規模情報の検索・提示
通过适应用户和情况的语音对话搜索和呈现大规模信息
  • 批准号:
    18049047
  • 财政年份:
    2006
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    16016250
  • 财政年份:
    2004
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    15017252
  • 财政年份:
    2003
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    14019052
  • 财政年份:
    2002
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas
複数話者の音声コミュニケーションの意図・状況理解
了解多说话者语音通信的意图和情况
  • 批准号:
    13224057
  • 财政年份:
    2001
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research on Priority Areas (C)

相似海外基金

病理画像診断の言語モデルをもった口腔がんの新たな診断法の基盤構築
使用病理图像诊断语言模型为新型口腔癌诊断方法奠定基础
  • 批准号:
    24K13114
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
大規模言語モデルと統語的言語モデルの融合
大规模语言模型与句法语言模型的融合
  • 批准号:
    24KJ0800
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
大規模言語モデルを使用した生成系AIによるAI搭載型治療方針決定支援ツールの開発
使用大规模语言模型的生成人工智能开发配备人工智能的治疗政策决策支持工具
  • 批准号:
    24K18785
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
From corpus to target data as steps for automatic assessment of L2 speech: L2 French phonological lexicon of Japanese learners
从语料库到目标数据作为 L2 语音自动评估的步骤:日语学习者的 L2 法语语音词典
  • 批准号:
    23K20100
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
言語の壁を超える低資源多言語Machine Speech Chain技術の構築
构建克服语言障碍的低资源多语言机器语音链技术
  • 批准号:
    23K21681
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
大規模言語モデルのための品質保証技術に関する研究
大规模语言模型质量保证技术研究
  • 批准号:
    24K02920
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
プログラミング教育支援のための大規模言語モデルへの入力情報に関する研究
支持编程教育的大规模语言模型输入信息研究
  • 批准号:
    24K15218
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
マルチモーダル情報を活用するタンパク質言語モデル
利用多模态信息的蛋白质语言模型
  • 批准号:
    24K20851
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
大規模言語モデルを用いた生物試料情報の標準化
使用大规模语言模型对生物样本信息进行标准化
  • 批准号:
    24K20889
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
大規模言語モデル(LLM)を用いた企業価値形成にかかる網羅的研究
使用大规模语言模型(LLM)对企业价值形成进行综合研究
  • 批准号:
    24K00298
  • 财政年份:
    2024
  • 资助金额:
    $ 0.64万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了