Development of a multi-modal dialogue system and a tool for a spoken dialogue system

多模态对话系统和口语对话系统工具的开发

基本信息

  • 批准号:
    08558030
  • 负责人:
  • 金额:
    $ 4.03万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
  • 财政年份:
    1996
  • 资助国家:
    日本
  • 起止时间:
    1996 至 1998
  • 项目状态:
    已结题

项目摘要

In this research, we published a continuous speech recognition free software which consists of a clients server architecture and thus a user can effectively use this software as a means of speech input modality for developing a spoken dealogue system or multimodal dialogue system on standard PCs.In order to realize natural human-macbin interaction, we have developed a multi-modal sightseeing guidance system with 1) speech input / output, 2) touch screen input (on map/in menu) and 3) graphical/text output (map, photograph, menu and dealogue historiy). Furthermore, we implemented an agent interface wiht real face image / animation and recorded speech / synthesized speech to the system, and carried out evaluation experiments which consist of task completions and questionnaires to evaluate the interface and whole system. The evaluation experiments showed the effectiveness.Recently the study of robustenss and usability for speech recognition and language processing has been established, and speech recognition systems and dialogue systems have been developed to be practical use. But if these systems will become practical, it is important that not only those fundamental techniques but also the techniques of portability and expansibility should be developed.Based on this consideration, we examined our system in portability by transfering the domain of the system form the Mt. Fuji sightseeing, guidance to the Mikawa sightseeing guidance. Also we designed a domain independent platform of spoken dialogue system for database retrival, and applied the platform to a literature retrieval system.
在本研究中,我们发布了一个连续语音识别的免费软件,它由客户机/服务器结构组成,因此用户可以有效地使用该软件作为语音输入方式,在标准PC上开发一个口语演示系统或多模态对话系统。为了实现自然的人机交互,我们开发了一个多模态的观光引导系统,该系统具有1)语音输入/输出,2)触摸屏输入(在地图上/菜单中)和3)图形/文本输出(地图、照片、菜单和历史记录)。在此基础上,我们实现了一个带有真实的人脸图像/动画和录音/合成语音的智能体界面,并通过任务完成和问卷调查对界面和整个系统进行了评价。评价实验表明了该方法的有效性。近年来,对语音识别和语言处理的鲁棒性和可用性的研究已经建立,语音识别系统和对话系统已经开发出实际应用。但是,如果这些系统将成为实用的,这是重要的,不仅是这些基本技术,而且还应开发的可移植性和可扩展性的技术。富士观光,指导到三川观光指导。设计了一个与领域无关的口语对话系统数据库检索平台,并将该平台应用于文献检索系统中。

项目成果

期刊论文数量(31)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
田窪 行則: "音声" 岩波書店, 256 (1998)
拓保幸纪:《声音》岩波书店,256 (1998)
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
A.Denda, T.Ito and S.Nakagawa: "A robust dialogue system with spontaneous speech and touch screen" Proc.Int.Conf.Multimodal Interface-96'. 144-151 (1996)
A.Denda、T.Ito 和 S.Nakakawa:“具有自发语音和触摸屏的强大对话系统”Proc.Int.Conf.Multimodal Interface-96。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
Min Zhou: "Succeding word prediction for speech recognition based on stochastic language model" Trans. IEICE Inf. & Syst.E79-D・4. 333-341 (1996)
周敏:“基于随机语言模型的语音识别的成功单词预测”Trans.E79-D·4(1996)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
伊藤敏彦: "マルチモーダルインターフェースと協調的応答を備えた観光案内対話システムの評価" 情報処理学会シンポジュウム、インタラクション'97. 135-142 (1997)
Toshihiko Ito:“具有多模式界面和协作响应的旅游信息对话系统的评估”日本信息处理协会研讨会,Interaction 97(1997)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
中川 聖一: "Bigramの使用による話し言葉用確率文脈自由文法の自動学習" 情報処理学会論文誌. 39・3. 575-584 (1998)
Seiichi Nakakawa:“使用 Bigram 自动学习口语的概率上下文无关语法”,日本信息处理学会汇刊 39・3(1998 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NAKAGAWA Seiichi其他文献

小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏
  • 通讯作者:
    堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵
  • 通讯作者:
    堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一
  • 通讯作者:
    中川聖一

NAKAGAWA Seiichi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NAKAGAWA Seiichi', 18)}}的其他基金

A detection method using relative phase information for spoofed speech based on speech synthesis, speaker adaptation and edited speech
一种基于语音合成、说话人适应和编辑语音的利用相对相位信息的欺骗语音检测方法
  • 批准号:
    16K12461
  • 财政年份:
    2016
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Study on privacy protection in spoken language
口语隐私保护研究
  • 批准号:
    22650034
  • 财政年份:
    2010
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
High accuracy transcription, cleaning and fast term detection for spoken documents
语音文档的高精度转录、清理和快速术语检测
  • 批准号:
    22300059
  • 财政年份:
    2010
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Automatic indexing for lecture speech and its advanced utilization through speech interaction
讲座演讲自动索引及其通过语音交互的高级利用
  • 批准号:
    17300064
  • 财政年份:
    2005
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on content summarization for large spoken documents and content retrieval through spoken dialogue
大型口语文档内容摘要及口语对话内容检索研究
  • 批准号:
    13480095
  • 财政年份:
    2001
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development for speech interface for form -based in formation access services on Web
基于表单的Web信息访问服务语音接口的开发
  • 批准号:
    13558033
  • 财政年份:
    2001
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Studies on Speech Recognition, Closed Caption and Summarization of Broadcast News
广播新闻语音识别、隐藏式字幕和摘要研究
  • 批准号:
    09480064
  • 财政年份:
    1997
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A study on multi-modal man-machine interface through spontaneous speech
基于自发语音的多模态人机界面研究
  • 批准号:
    06452401
  • 财政年份:
    1994
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
A Research for the Formation of Basic Concepts in Physics
物理学基本概念形成的研究
  • 批准号:
    05680163
  • 财政年份:
    1993
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (C)
A Study on Ambiguous Utterance Understanding for Speech Input
语音输入的歧义话语理解研究
  • 批准号:
    03452167
  • 财政年份:
    1991
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for General Scientific Research (B)

相似海外基金

Development of clinical information with bioresource management system and free software distribution trial.
使用生物资源管理系统和免费软件分发试用开发临床信息。
  • 批准号:
    15K15735
  • 财政年份:
    2015
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Challenging Exploratory Research
Participation in Free Software Development
参与自由软件开发
  • 批准号:
    1026818
  • 财政年份:
    2010
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Standard Grant
New development of research on bug-free software construction environment
无缺陷软件构建环境研究新进展
  • 批准号:
    22300008
  • 财政年份:
    2010
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Economic Organization, Performance and Viability of Open Source/Free Software Development
经济组织、开源/自由软件开发的性能和可行性
  • 批准号:
    0329259
  • 财政年份:
    2003
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Continuing Grant
Development of Free Software for Practical Compiler Generator Based on Attribute Grammars
基于属性文法的实用编译生成器免费软件的开发
  • 批准号:
    05558028
  • 财政年份:
    1994
  • 资助金额:
    $ 4.03万
  • 项目类别:
    Grant-in-Aid for Developmental Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了