权益分类	功能权益	普通用户	{{item.name}}会员
{{category.name}}	{{benefitItem.name}}

Improvement of Spoken Term Detection Technique and its Application to Speech Recognition and Spoken Document Retrieval

口语检测技术的改进及其在语音识别和口语文档检索中的应用

基本信息

批准号：
23700111
负责人：
NISHIZAKI Hiromitsu
金额：
$ 2.66万
依托单位：
University of Yamanashi
依托单位国家：
日本
项目类别：
Grant-in-Aid for Young Scientists (B)
财政年份：
2011
资助国家：
日本
起止时间：
2011 至 2013
项目状态：
已结题

来源：
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-23700111/
关键词：
音声中の検索語検出音声認識音声ドキュメント検索音声ドキュメント処理機械学習情報検索 STD応用言語モデル音声インタフェース音声内容検索音声中の検索語検出（STD）音声ドキュメント検索（SDR）

项目摘要

The goal of this study is refinement of the spoken term detection (STD) technique. An STD technology can detect speech intervals, where query terms are uttered, in lots of spoken documents. In addition, I also aim at adapting the STD method to other technologies such as speech recognition for improving their refinement. I developed the STD methods using multiple speech recognizers' outputs, confidence measures based on majority voting, and machine learning. In the experiment on STD, my techniques achieved improvement of the STD performance comparing to the baseline system. In addition, I adopted my STD technique to making recognition dictionary, which is necessary for speech recognition. In the result, my technique improves speech recognition performance. Furthermore, I implemented the STD technique to an electronic note-taking support system and evaluated its effectiveness of utilization of the STD technique. The system with STD is useful for retrieving words from multimedia data.

本研究的目标是改进口语检测(STD)技术。STD技术可以在大量口语文档中检测发出查询词语的语音间隔。此外，我还致力于将STD方法应用于其他技术，如语音识别，以提高它们的精确度。我使用多个语音识别器的输出、基于多数投票的置信度测量和机器学习来开发STD方法。在对STD的实验中，与基准系统相比，我的技术实现了STD性能的提高。此外，我还采用自己的STD技术制作了语音识别所必需的识别词典。结果，我的技术提高了语音识别性能。此外，我将STD技术应用到一个电子笔记支持系统中，并对其使用STD技术的效果进行了评估。具有STD的系统对于从多媒体数据中检索单词是有用的。

项目成果

期刊论文数量（0）

专著数量（0）

科研奖励数量（0）

会议论文数量（0）

专利数量（0）

音声ドキュメント内容検索のためのWEBを用いたドキュメント拡張

使用网络进行文档扩展进行音频文档内容搜索

DOI：
发表时间：
2011
期刊：
情報処理学会論文誌
影响因子：
0
作者：
Manabu Ohta;Daiki Arauchi;Atsuhiro Takasu;and Jun Adachi;光藤雄一;西崎博光,杉本樹世貴,関口芳廣
通讯作者：
西崎博光,杉本樹世貴,関口芳廣

STD システムへの音素間距離の導入方法の検討

关于如何将间音距离引入STD系统的思考

DOI：
发表时间：
2014
期刊：
影响因子：
0
作者：
Kaishi Hirahara;Keiichi Tamura;Hajime Kitakami;and Shingo Tamura;澤田直輝,古屋裕斗,名取賢,西崎博光,関口芳廣
通讯作者：
澤田直輝,古屋裕斗,名取賢,西崎博光,関口芳廣

キーワード集合をクエリとする最良照合STD方式

使用关键字集作为查询的最佳匹配 STD 方法

DOI：
发表时间：
期刊：
影响因子：
0
作者：
井上諒平;太田学;高須淳宏;堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光
通讯作者：
堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光

音声ドキュメントからの頻出発話語句の発見”，第8回音声ドキュメント処理ワークショップ講演論文集

《从语音文档中发现常用词》，第八届口语文档处理研讨会论文集

DOI：
发表时间：
期刊：
影响因子：
0
作者：
米倉千冬，古屋裕斗，澤田直輝，名取賢，西崎博光，関口芳廣
通讯作者：
米倉千冬，古屋裕斗，澤田直輝，名取賢，西崎博光，関口芳廣

キーワード集合をクエリとする最良照合 STD による音声ドキュメント索引付け

使用一组关键字作为查询，使用最佳匹配 STD 进行音频文档索引

DOI：
发表时间：
期刊：
影响因子：
0
作者：
米倉千冬，古屋裕斗，澤田直輝，名取賢，西崎博光，関口芳廣;渡邉英徳，石堂めぐむ，矢野一郎;Keiichi Tamura,and Hajime Kitakami;澤田直輝，古屋裕斗，名取賢，西崎博光，関口芳廣;高田百合奈,蜂谷聖未,三原悠里,渡邉英徳;Keiichi Tamura and Hajime Kitakami;堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光
通讯作者：
堂元健太郎，宇津呂武仁，古屋裕斗，西崎博光