A study on multi-modal man-machine interface through spontaneous speech
基于自发语音的多模态人机界面研究
基本信息
- 批准号:06452401
- 负责人:
- 金额:$ 3.39万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:1994
- 资助国家:日本
- 起止时间:1994 至 1996
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
We developed a malti-modal dialogue system that is composed of 4 parts : input by speech recognizer and touch screen, graphical user interface, natural language interpreter, and response generater.Our speech recognizer intergrates the acoustic process with linguistic process directly without the phrase or word lattice. Furthermore, the recognizer processes interjections and restarts based on an unknown word processing technique.A context free grammar is made to be able to accept sentences with omitted post-positions and inversion of word in order to recognize spontaneous speech.Although our spontaneous speech recognizer outputs some errors caused by misrecognition (substitution errors), out of vacabulary (unknown words) and out of grammar (illegal utterances), the language interpreter can understand the meaning of errorful/illegal utterances.The input by touch screen is used to designate the location of map on the display or to select the desired item form the menu which consists of the set of items responded by a speech synthesizer. We use boht the display output (map and menu) and speech systhesis for the response. User can use the postioning / selecting input and speech input at the same time. On man-machine communication, user wants to know his or machine situation what information he gets from the dialogue or how machine interprets / understands his utterances, as well as the speech recognition result. Therefore our system displays the history of dialogue. This function helps to eliminate the user uneasiness. Experimental evalution showed that our interpretation mechanism was suitable for understanding the recognition result of spontaneous speech. And we found that the multi-modal interface with spontaneous speech and touch screen was user-friendly.
我们开发了一个多模态对话系统,它由四个部分组成:语音识别器和触摸屏输入,图形用户界面,自然语言解释器和响应发生器。本文提出了一种上下文无关的语法,使其能够接受省略了后置词和倒装词的句子,从而实现了对自发语音的识别(替换错误),超出真空(unknown words)and out of grammar(不认识的词)(非法言论),语言解释器可以理解错误/通过触摸屏的输入用于指定地图在显示器上的位置或从由语音合成器响应的项目集合组成的菜单中选择期望的项目。我们使用显示输出(地图和菜单)和语音合成作为响应。用户可以同时使用定位/选择输入和语音输入。在人机对话中,用户希望了解自己或机器的情况,从对话中得到什么信息,机器如何解释/理解他的话语,以及语音识别的结果。因此,我们的系统显示对话的历史。此功能有助于消除用户的不安。实验结果表明,我们的解释机制是适合理解自发语音的识别结果。我们发现,多模态界面与自发语音和触摸屏是用户友好的。
项目成果
期刊论文数量(22)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
中川聖一: "音声と直指操作による入力インターフェース" 電気学会論文誌. 1140-C. 1009-1017 (1994)
Seiichi Nakakawa:“使用语音和直接手指操作的输入界面”,日本电气工程师学会汇刊 1140-C 1009-1017 (1994)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
山本幹雄: "メニューによりガイドされた文節単位による音声対話システム" 情報処理学会論文誌. 37・4. 461-469 (1996)
Mikio Yamamoto:“基于菜单引导的短语的语音对话系统”,日本信息处理学会汇刊 37・4(1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
山本幹雄: "人間の理解手法を用いたロバストな音声対話システム" 情報処理学会論文誌. 37・4. 471-481 (1996)
Mikio Yamamoto:“使用人类理解方法的鲁棒口语对话系统”,日本信息处理学会汇刊 37・4(1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Min Zhou: "Succeding word prediction for speech recognition based on stochastic language model" Trans. IEICE Inf. & Syst.E79-D・4. 333-341 (1996)
周敏:“基于随机语言模型的语音识别的成功单词预测”Trans.E79-D·4(1996)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Mikio Yamamoto, Mitsunori Takagi and Seiichi Nakagawa: "A menu-guided spoken dialog system by phrase utterance" Trans.Information Processig Society of Japan. Vol.37, No.4 (in Japanese). 461-469 (1996)
Mikio Yamamoto、Mitsunori Takagi 和 Seiichi Nakakawa:“通过短语表达的菜单引导口语对话系统”日本信息处理协会。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
NAKAGAWA Seiichi其他文献
小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏 - 通讯作者:
堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵 - 通讯作者:
堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一 - 通讯作者:
中川聖一
NAKAGAWA Seiichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('NAKAGAWA Seiichi', 18)}}的其他基金
A detection method using relative phase information for spoofed speech based on speech synthesis, speaker adaptation and edited speech
一种基于语音合成、说话人适应和编辑语音的利用相对相位信息的欺骗语音检测方法
- 批准号:
16K12461 - 财政年份:2016
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Study on privacy protection in spoken language
口语隐私保护研究
- 批准号:
22650034 - 财政年份:2010
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
High accuracy transcription, cleaning and fast term detection for spoken documents
语音文档的高精度转录、清理和快速术语检测
- 批准号:
22300059 - 财政年份:2010
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Automatic indexing for lecture speech and its advanced utilization through speech interaction
讲座演讲自动索引及其通过语音交互的高级利用
- 批准号:
17300064 - 财政年份:2005
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A study on content summarization for large spoken documents and content retrieval through spoken dialogue
大型口语文档内容摘要及口语对话内容检索研究
- 批准号:
13480095 - 财政年份:2001
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development for speech interface for form -based in formation access services on Web
基于表单的Web信息访问服务语音接口的开发
- 批准号:
13558033 - 财政年份:2001
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Studies on Speech Recognition, Closed Caption and Summarization of Broadcast News
广播新闻语音识别、隐藏式字幕和摘要研究
- 批准号:
09480064 - 财政年份:1997
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of a multi-modal dialogue system and a tool for a spoken dialogue system
多模态对话系统和口语对话系统工具的开发
- 批准号:
08558030 - 财政年份:1996
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Research for the Formation of Basic Concepts in Physics
物理学基本概念形成的研究
- 批准号:
05680163 - 财政年份:1993
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
A Study on Ambiguous Utterance Understanding for Speech Input
语音输入的歧义话语理解研究
- 批准号:
03452167 - 财政年份:1991
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
相似海外基金
An investigation of generative acoustic latent representations for meeting speech recognition and summarization
用于满足语音识别和摘要的生成声学潜在表示的研究
- 批准号:
24K15004 - 财政年份:2024
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Disrupter or enabler? Assessing the impact of using automatic speech recognition technology in interpreter-mediated legal proceedings
颠覆者还是推动者?
- 批准号:
2889440 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Studentship
Analysis of speech recognition as a tool in medical English education
语音识别作为医学英语教育工具的分析
- 批准号:
23K00767 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Industrial research into the reduction of biases in foundational Automatic Speech Recognition models.
减少基础自动语音识别模型中偏差的工业研究。
- 批准号:
10068091 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Collaborative R&D
M3OLR: Towards Effective Multilingual, Multimodal and Multitask Oriental Low-resourced Language Speech Recognition
M3OLR:迈向有效的多语言、多模态和多任务东方稀缺语言语音识别
- 批准号:
23K11227 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Automatic Speech Recognition (ASR) engine to improve autistic children speech
自动语音识别(ASR)引擎可改善自闭症儿童的言语能力
- 批准号:
10056712 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Grant for R&D
Establishment of intraoperative education model using speech recognition and language information processing technology
利用语音识别和语言信息处理技术建立术中教育模型
- 批准号:
23K16281 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
SaTC: CORE: Small: Robust Speaker and Speech Recognition Under AI-Driven Physical and Digital Attacks
SaTC:核心:小型:人工智能驱动的物理和数字攻击下的鲁棒扬声器和语音识别
- 批准号:
2310207 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
Continuing Grant
A State-of-the-Art Automatic Speech Recognition and Conversational Platform to Enable Socially Assistive Robots for Persons with Alzheimer's Disease and Related Dementias
最先进的自动语音识别和对话平台,为阿尔茨海默病和相关痴呆症患者提供社交辅助机器人
- 批准号:
10699887 - 财政年份:2023
- 资助金额:
$ 3.39万 - 项目类别:
CRCNS US-Spain Research Proposal: Collaborative Research: Tracking and modeling the neurobiology of multilingual speech recognition
CRCNS 美国-西班牙研究提案:合作研究:跟踪和建模多语言语音识别的神经生物学
- 批准号:
2207770 - 财政年份:2022
- 资助金额:
$ 3.39万 - 项目类别:
Continuing Grant