Development for speech interface for form -based in formation access services on Web
基于表单的Web信息访问服务语音接口的开发
基本信息
- 批准号:13558033
- 负责人:
- 金额:$ 4.29万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (B)
- 财政年份:2001
- 资助国家:日本
- 起止时间:2001 至 2003
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
While some speech interface systems have been developed for accessing Web resources, they are limited for accessing some specific contents and they don't provide a universal interface for arbitrary information retrieval services on the WWW. We propose an interactive speech user interface system, which could be applied to many form-based information retrieval services of the WVVW. In particular, our system was implemented based on a client-server, a Web proxy-centered architecture and employed an information extraction and language processing of HTML documents for providing a general-purpose interface for many form-based WWW contents. We also performed some experiments by 12 subjects for the comparison of the usability under different usage conditions. As a result, the proposed system attained comparative and higher expected usability measures over the pen-touch input method under the condition of an ideal speech recognition performance, and could be expected to achieve the effectivenes … More s or the superiority over a pen touch-only interface in terms of the usability as their usage condition approaches to a realistic PDA usage condition.We also proposed an. interface for a name input based on speech recognition using syllable-based N-gram and a word dictionary, which was frequently required to input into form-based web pages. User first utters a name and then chooses the correct word/syllables by pen touch from word/syllable candidates which were obtained from speech recognition. Name utterance is hard to recognize accurately because of the large vocabulary size, so the system uses continuous syllable recognition with syllable-based N-gram and isolated word recognition with a dictionary containing frequent words. The user can find the correct the answer from word candidates or syllable sequence candidates at a rate of 82-86%, and can input correct name at a rate of 94-96% with syllable selection from the syllable lattice. Some subjects used this interface and felt that it was useful. Less
虽然已经开发了一些用于访问Web资源的语音接口系统,但它们在访问某些特定内容方面受到限制,并且不能为WWW上的任意信息检索服务提供通用接口。提出了一种交互式语音用户界面系统,该系统可应用于多种基于表单的信息检索服务。特别地,我们的系统是基于客户机-服务器、以Web代理为中心的体系结构实现的,并采用了HTML文档的信息提取和语言处理,为许多基于表单的WWW内容提供了一个通用的接口。我们还对12名受试者进行了实验,比较了不同使用条件下的可用性。结果表明,在理想的语音识别性能条件下,所提出的系统在可用性方面达到了与笔触输入法相比的较高的预期可用性指标,并且随着其使用条件接近于实际的PDA使用条件,可以预期达到比笔触输入法更大的可用性优势。我们还提出了一个。使用基于音节的N-gram和单词字典的基于语音识别的名称输入接口,这经常需要输入到基于表单的网页中。用户先说出一个名字,然后通过笔触从语音识别得到的候选词/音节中选择正确的词/音节。由于词汇量大,人名发音难以准确识别,因此系统采用基于音节的N-gram连续音节识别和包含频繁词的字典孤立词识别。用户从候选词或音节序列候选词中找到正确答案的率为82-86%,从音节格中选择音节输入正确名称的率为94-96%。一些受试者使用了这个界面,并觉得它很有用。少
项目成果
期刊论文数量(25)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
山田大輔, 北岡教英, 中川聖一: "音源情報の特徴量を用いた音声認識"電気学会電子情報システム部門誌(C). 122・C・12. 2028-2034 (2002)
山田大辅、北冈纪英、中川精一:“利用声源信息特征的语音识别”日本电气工程学会电子信息系统分部期刊(C)122・C・12 2028-2034(2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
松下雅彦: "音声入力によるWeb検索のためのキーワード認識・抽出法の検討"情報処理学会,音声言語情報処理. SLP-48(4). 21-28 (2003)
Masahiko Matsushita:“使用语音输入进行网络搜索的关键字识别和提取方法的研究”,日本信息处理学会,语音和语言信息处理。21-28(2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
押川 洋徳, 北岡 教英, 中川 聖一: "ウェブブラウザにおける任意文字列入力を目的とした音声入力インターフェース"日本音響学会春季研究発表会. 217-218 (2002)
Hironori Oshikawa、Norihide Kitaoka 和 Seiichi Nakakawa:“在网络浏览器中输入任意字符串的语音输入接口”日本声学学会春季会议 217-218 (2002)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
押川洋徳: "音節N-gramと単語辞書併用による姓名入力インターフェース"情報処理学会,音声言語情報処理. SLP-49(30). 175-180 (2003)
Hironori Oshikawa:“使用音节 N-gram 和单词词典的名称输入界面”,日本信息处理学会,SLP-49(30) (2003)。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
Masahiko Matsushita: "Keyword recognition and extraction for speech-driven Web retrieval task (in Japanese)"Information Processing Society of Japan. SLP48, 4. 21-28 (2003)
Masahiko Matsushita:“语音驱动的 Web 检索任务的关键字识别和提取(日语)”日本信息处理学会。
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
- 通讯作者:
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
NAKAGAWA Seiichi其他文献
小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏 - 通讯作者:
堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵 - 通讯作者:
堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一 - 通讯作者:
中川聖一
NAKAGAWA Seiichi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('NAKAGAWA Seiichi', 18)}}的其他基金
A detection method using relative phase information for spoofed speech based on speech synthesis, speaker adaptation and edited speech
一种基于语音合成、说话人适应和编辑语音的利用相对相位信息的欺骗语音检测方法
- 批准号:
16K12461 - 财政年份:2016
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
Study on privacy protection in spoken language
口语隐私保护研究
- 批准号:
22650034 - 财政年份:2010
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Challenging Exploratory Research
High accuracy transcription, cleaning and fast term detection for spoken documents
语音文档的高精度转录、清理和快速术语检测
- 批准号:
22300059 - 财政年份:2010
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Automatic indexing for lecture speech and its advanced utilization through speech interaction
讲座演讲自动索引及其通过语音交互的高级利用
- 批准号:
17300064 - 财政年份:2005
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A study on content summarization for large spoken documents and content retrieval through spoken dialogue
大型口语文档内容摘要及口语对话内容检索研究
- 批准号:
13480095 - 财政年份:2001
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Studies on Speech Recognition, Closed Caption and Summarization of Broadcast News
广播新闻语音识别、隐藏式字幕和摘要研究
- 批准号:
09480064 - 财政年份:1997
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Development of a multi-modal dialogue system and a tool for a spoken dialogue system
多模态对话系统和口语对话系统工具的开发
- 批准号:
08558030 - 财政年份:1996
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A study on multi-modal man-machine interface through spontaneous speech
基于自发语音的多模态人机界面研究
- 批准号:
06452401 - 财政年份:1994
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
A Research for the Formation of Basic Concepts in Physics
物理学基本概念形成的研究
- 批准号:
05680163 - 财政年份:1993
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for General Scientific Research (C)
A Study on Ambiguous Utterance Understanding for Speech Input
语音输入的歧义话语理解研究
- 批准号:
03452167 - 财政年份:1991
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for General Scientific Research (B)
相似海外基金
Travel: Student Support for the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR 2024)
旅行:学生支持第 47 届国际 ACM SIGIR 信息检索研究与发展会议 (SIGIR 2024)
- 批准号:
2409649 - 财政年份:2024
- 资助金额:
$ 4.29万 - 项目类别:
Standard Grant
CAREER: Explanation-based Optimization of Diversified Information Retrieval to Enhance AI Systems
职业:基于解释的多样化信息检索优化以增强人工智能系统
- 批准号:
2339932 - 财政年份:2024
- 资助金额:
$ 4.29万 - 项目类别:
Continuing Grant
SBIR Phase I: Knowledge Graph-powered Information Retrieval and Causal Inference
SBIR 第一阶段:知识图谱驱动的信息检索和因果推理
- 批准号:
2335357 - 财政年份:2024
- 资助金额:
$ 4.29万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Communication-Efficient, Fault-Tolerant Private Information Retrieval over Erasure Coded Storage
SaTC:核心:小型:通过纠删码存储进行通信高效、容错的私人信息检索
- 批准号:
2326312 - 财政年份:2023
- 资助金额:
$ 4.29万 - 项目类别:
Continuing Grant
SaTC: CORE: Small: Practical Private Information Retrieval
SaTC:核心:小型:实用的私人信息检索
- 批准号:
2246386 - 财政年份:2023
- 资助金额:
$ 4.29万 - 项目类别:
Standard Grant
A Study on Information Retrieval by Similarity and Heterogeneity of Concepts
基于概念相似性和异质性的信息检索研究
- 批准号:
23K11764 - 财政年份:2023
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Large-scale general-purpose language models for information retrieval tasks
用于信息检索任务的大规模通用语言模型
- 批准号:
22K21303 - 财政年份:2022
- 资助金额:
$ 4.29万 - 项目类别:
Grant-in-Aid for Research Activity Start-up
Studying Visual Analytics Support for Interactive Information Retrieval within Complex Search Settings
研究复杂搜索设置中交互式信息检索的视觉分析支持
- 批准号:
RGPIN-2017-06446 - 财政年份:2022
- 资助金额:
$ 4.29万 - 项目类别:
Discovery Grants Program - Individual
Time-aware Community-enhanced Social Information Retrieval
时间感知社区增强社交信息检索
- 批准号:
RGPIN-2021-03170 - 财政年份:2022
- 资助金额:
$ 4.29万 - 项目类别:
Discovery Grants Program - Individual
Statistical Computation and Information Retrieval from Multivariate Data
多元数据的统计计算和信息检索
- 批准号:
RGPIN-2018-05663 - 财政年份:2022
- 资助金额:
$ 4.29万 - 项目类别:
Discovery Grants Program - Individual