Development of a Speech Understanding system and a Spoken Dialog system

语音理解系统和口语对话系统的开发

基本信息

  • 批准号:
    02555067
  • 负责人:
  • 金额:
    $ 6.78万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
  • 财政年份:
    1990
  • 资助国家:
    日本
  • 起止时间:
    1990 至 1992
  • 项目状态:
    已结题

项目摘要

We developed the spoken Japanese dialog system. This dialog system is in the closed world of sightseeing guide. The system guides the information about singhtseeing, and user can input to the system through natural language speech. This sysem consists of speech recognition part, sentence understanding part, dialog proessing part, user utterance prediction part, and so on.The speech recognition part recognized the input speech using syllable HMMs (Hidden Markov Model) that model the syllables of speech. CFG (Context Free Grammar) is used for modeling the linguistical restriction of user utterances.In the sentence understanding part, the text obtained form the speech recognition is processed using Japanese lexicon and KAKARIUKE rules (dependency grammar), then transformed to the semantic network using case frames.In the dialog processing part, the ellipsis complement and pronoun reference are performed, then the dialog is proceeded by the interpretation of the dialog rules. This dialog rules can easily adjusted to the various situations.In the dialog, ambiguities of meanings of input sentences often occur. The part of dialog for clarification and verification is performed to disambiguate them. The system leads the user and asks the user a question positively to get the information for the disambiguation. There process can make the dialog certainly.On such a limitative task domain, however, user tends to speak various sentence types, so it is difficult to recognize the speech correctly. The user utterance prediction part predicts the word/syntax of user's utterance for the system's response to improve the reliability of spoken dialog between the system and user.On the system evaluation, we got the enough speech recognition rate for progressing the dialog, The dialog system could converse with a user naturally.
我们开发了日语口语对话系统。这个对话系统是在封闭的世界观光导游。该系统对旅游信息进行引导,用户可以通过自然语言语音输入系统。该系统由语音识别部分、句子理解部分、对话处理部分、用户话语预测部分等部分组成,语音识别部分采用音节Hacker(隐马尔可夫模型)对语音的音节进行建模,对输入语音进行识别。CFG在句子理解部分,利用日语词典和KAKARIUKE规则对语音识别得到的文本进行处理在对话处理部分,进行省略补语和代词指称,则通过对对话规则的解释来进行对话。这种对话规则可以很容易地根据不同的情况进行调整。对话的澄清和验证部分是为了消除它们的歧义。该系统引导用户并向用户提出积极的问题,以获得消歧的信息。然而,在这样一个有限的任务域上,用户往往会说各种各样的句子类型,因此很难正确地识别语音。用户话语预测部分预测用户话语的单词/语法以供系统响应,以提高系统与用户之间口语对话的可靠性。在系统评估中,我们获得了足够的语音识别率来进行对话,对话系统可以与用户自然匡威。

项目成果

期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Mikio YAMAMOTO: "A Spoken dialog system with verification and Clarification queries" IEICE Trans.Inf & Syst.E76-D. 84-94 (1993)
Mikio YAMAMOTO:“带有验证和澄清查询的语音对话系统” IEICE Trans.Inf
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
S.Nakagawa,Y.Hashimoto: "Segmentation of Continuows Speech by HMM and Bayesian Probabity." System and Computers in Japan. 21. 23-32 (1990)
S.Nakakawa,Y.Hashimoto:“通过 HMM 和贝叶斯概率对连续语音进行分割。”
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川 聖一,竹本 信治,田口 勝豊: "交通規則文に関する質問応答システムLICENCEにおける日本語文からの一階述語論理式への変換" 情報処理学会論文誌. 32. (1991)
Seiichi Nakakawa、Shinji Takemoto、Katsutoyo Taguchi:“从日语句子到有关交通规则句子的问答系统 LICENSE 中的一阶谓词逻辑公式的转换”,日本信息处理学会汇刊 32。(1991 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川 聖一: "ニューラルネットワークによる確率密度関数・事後確率の推定と母音認識" 電子情報通信学会論文誌. 76-DII. (1993)
Seiichi Nakakawa:“使用神经网络估计概率密度函数和后验概率以及元音识别”电子、信息和通信工程师学会汇刊 (1993)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Mikio Yamamoto: "A Spokin dialog systim with verification and clarification queries" IEICE Trans.Inf & Syst.E76-D. 84-94 (1993)
Mikio Yamamoto:“带有验证和澄清查询的 Spokin 对话系统” IEICE Trans.Inf
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NAKAGAWA Seiichi其他文献

小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏
  • 通讯作者:
    堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵
  • 通讯作者:
    堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一
  • 通讯作者:
    中川聖一

NAKAGAWA Seiichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NAKAGAWA Seiichi', 18)}}的其他基金

A detection method using relative phase information for spoofed speech based on speech synthesis, speaker adaptation and edited speech
一种基于语音合成、说话人适应和编辑语音的利用相对相位信息的欺骗语音检测方法
  • 批准号:
    16K12461
  • 财政年份:
    2016
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Study on privacy protection in spoken language
口语隐私保护研究
  • 批准号:
    22650034
  • 财政年份:
    2010
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
High accuracy transcription, cleaning and fast term detection for spoken documents
语音文档的高精度转录、清理和快速术语检测
  • 批准号:
    22300059
  • 财政年份:
    2010
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Automatic indexing for lecture speech and its advanced utilization through speech interaction
讲座演讲自动索引及其通过语音交互的高级利用
  • 批准号:
    17300064
  • 财政年份:
    2005
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on content summarization for large spoken documents and content retrieval through spoken dialogue
大型口语文档内容摘要及口语对话内容检索研究
  • 批准号:
    13480095
  • 财政年份:
    2001
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development for speech interface for form -based in formation access services on Web
基于表单的Web信息访问服务语音接口的开发
  • 批准号:
    13558033
  • 财政年份:
    2001
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Speech Recognition, Closed Caption and Summarization of Broadcast News
广播新闻语音识别、隐藏式字幕和摘要研究
  • 批准号:
    09480064
  • 财政年份:
    1997
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of a multi-modal dialogue system and a tool for a spoken dialogue system
多模态对话系统和口语对话系统工具的开发
  • 批准号:
    08558030
  • 财政年份:
    1996
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on multi-modal man-machine interface through spontaneous speech
基于自发语音的多模态人机界面研究
  • 批准号:
    06452401
  • 财政年份:
    1994
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Research for the Formation of Basic Concepts in Physics
物理学基本概念形成的研究
  • 批准号:
    05680163
  • 财政年份:
    1993
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)

相似海外基金

Peripheral and central contributions to auditory temporal processing deficits and speech understanding in older cochlear implantees
外周和中枢对老年人工耳蜗植入者听觉时间处理缺陷和言语理解的贡献
  • 批准号:
    10444172
  • 财政年份:
    2022
  • 资助金额:
    $ 6.78万
  • 项目类别:
Effects of Non-Blast mTBI on Binaural Processing and Speech Understanding in Noise
Non-Blast mTBI 对噪声中双耳处理和语音理解的影响
  • 批准号:
    10537947
  • 财政年份:
    2022
  • 资助金额:
    $ 6.78万
  • 项目类别:
Peripheral and central contributions to auditory temporal processing deficits and speech understanding in older cochlear implantees
外周和中枢对老年人工耳蜗植入者听觉时间处理缺陷和言语理解的贡献
  • 批准号:
    10630111
  • 财政年份:
    2022
  • 资助金额:
    $ 6.78万
  • 项目类别:
Individual differences in brain networks supporting speech understanding in patients with cochlear implants
支持人工耳蜗患者言语理解的大脑网络的个体差异
  • 批准号:
    10366520
  • 财政年份:
    2021
  • 资助金额:
    $ 6.78万
  • 项目类别:
Individual differences in brain networks supporting speech understanding in patientswith cochlear implants
支持人工耳蜗植入患者言语理解的大脑网络的个体差异
  • 批准号:
    10743568
  • 财政年份:
    2021
  • 资助金额:
    $ 6.78万
  • 项目类别:
End-to-End Model for Task-Independent Speech Understanding and Dialogue
与任务无关的语音理解和对话的端到端模型
  • 批准号:
    20H00602
  • 财政年份:
    2020
  • 资助金额:
    $ 6.78万
  • 项目类别:
    Grant-in-Aid for Scientific Research (A)
Speech understanding ability and communication intervention for persons with age-related hearing loss and mild cognitive impairment or dementia
年龄相关性听力损失和轻度认知障碍或痴呆患者的言语理解能力和沟通干预
  • 批准号:
    10437659
  • 财政年份:
    2018
  • 资助金额:
    $ 6.78万
  • 项目类别:
Speech understanding ability and communication intervention for persons with age-related hearing loss and mild cognitive impairment or dementia
年龄相关性听力损失和轻度认知障碍或痴呆患者的言语理解能力和沟通干预
  • 批准号:
    10201560
  • 财政年份:
    2018
  • 资助金额:
    $ 6.78万
  • 项目类别:
Using Electrophysiology to Complement Speech Understanding-in-Noise Measures
使用电生理学补充噪声中的语音理解测量
  • 批准号:
    9906072
  • 财政年份:
    2017
  • 资助金额:
    $ 6.78万
  • 项目类别:
Temporal processing and speech understanding in older cochlear implantees
老年人工耳蜗植入者的时间处理和言语理解
  • 批准号:
    9355563
  • 财政年份:
    2016
  • 资助金额:
    $ 6.78万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了