Improvement of Spoken Term Detection Technique and its Application to Speech Recognition and Spoken Document Retrieval

口语检测技术的改进及其在语音识别和口语文档检索中的应用

基本信息

  • 批准号:
    23700111
  • 负责人:
  • 金额:
    $ 2.66万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2011
  • 资助国家:
    日本
  • 起止时间:
    2011 至 2013
  • 项目状态:
    已结题

项目摘要

The goal of this study is refinement of the spoken term detection (STD) technique. An STD technology can detect speech intervals, where query terms are uttered, in lots of spoken documents. In addition, I also aim at adapting the STD method to other technologies such as speech recognition for improving their refinement. I developed the STD methods using multiple speech recognizers' outputs, confidence measures based on majority voting, and machine learning. In the experiment on STD, my techniques achieved improvement of the STD performance comparing to the baseline system. In addition, I adopted my STD technique to making recognition dictionary, which is necessary for speech recognition. In the result, my technique improves speech recognition performance. Furthermore, I implemented the STD technique to an electronic note-taking support system and evaluated its effectiveness of utilization of the STD technique. The system with STD is useful for retrieving words from multimedia data.
本研究的目标是改进口语检测(STD)技术。STD技术可以在大量口语文档中检测发出查询词语的语音间隔。此外,我还致力于将STD方法应用于其他技术,如语音识别,以提高它们的精确度。我使用多个语音识别器的输出、基于多数投票的置信度测量和机器学习来开发STD方法。在对STD的实验中,与基准系统相比,我的技术实现了STD性能的提高。此外,我还采用自己的STD技术制作了语音识别所必需的识别词典。结果,我的技术提高了语音识别性能。此外,我将STD技术应用到一个电子笔记支持系统中,并对其使用STD技术的效果进行了评估。具有STD的系统对于从多媒体数据中检索单词是有用的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
音声ドキュメント内容検索のためのWEBを用いたドキュメント拡張
使用网络进行文档扩展进行音频文档内容搜索
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Manabu Ohta;Daiki Arauchi;Atsuhiro Takasu;and Jun Adachi;光藤雄一;西崎博光,杉本樹世貴,関口芳廣
  • 通讯作者:
    西崎博光,杉本樹世貴,関口芳廣
STD システムへの音素間距離の導入方法の検討
关于如何将间音距离引入STD系统的思考
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kaishi Hirahara;Keiichi Tamura;Hajime Kitakami;and Shingo Tamura;澤田直輝,古屋裕斗,名取賢,西崎博光,関口芳廣
  • 通讯作者:
    澤田直輝,古屋裕斗,名取賢,西崎博光,関口芳廣
キーワード集合をクエリとする最良照合STD方式
使用关键字集作为查询的最佳匹配 STD 方法
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    井上 諒平;太田 学;高須 淳宏;堂元健太郎,宇津呂武仁,古屋裕斗,西崎博光
  • 通讯作者:
    堂元健太郎,宇津呂武仁,古屋裕斗,西崎博光
音声ドキュメントからの頻出発話語句の発見”,第8回音声ドキュメント処理ワークショップ講演論文集
《从语音文档中发现常用词》,第八届口语文档处理研讨会论文集
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    米倉千冬,古屋裕斗,澤田直輝,名取賢,西崎博光,関口芳廣
  • 通讯作者:
    米倉千冬,古屋裕斗,澤田直輝,名取賢,西崎博光,関口芳廣
キーワード集合をクエリとする最良照合 STD による音声ドキュメント索引付け
使用一组关键字作为查询,使用最佳匹配 STD 进行音频文档索引
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    米倉千冬,古屋裕斗,澤田直輝,名取賢,西崎博光,関口芳廣;渡邉英徳,石堂めぐむ,矢野一郎;Keiichi Tamura,and Hajime Kitakami;澤田直輝,古屋裕斗,名取賢,西崎博光,関口芳廣;高田百合奈,蜂谷聖未,三原悠里,渡邉英徳;Keiichi Tamura and Hajime Kitakami;堂元健太郎,宇津呂武仁,古屋裕斗,西崎博光
  • 通讯作者:
    堂元健太郎,宇津呂武仁,古屋裕斗,西崎博光
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

NISHIZAKI Hiromitsu其他文献

Comparative Evaluation of Diverse Features in Fluency Evaluation of Spontaneous Speech
自发语音流利度评价中不同特征的比较评价
  • DOI:
    10.1587/transinf.2022edp7047
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0.7
  • 作者:
    DENG Huaijin;UTSURO Takehito;KOBAYASHI Akio;NISHIZAKI Hiromitsu
  • 通讯作者:
    NISHIZAKI Hiromitsu
普通の教師が生きる学校 モンスター・ペアレント論を超えて(第495回)「担任代われ」が普通に出る時代(5)都市部から全国へ
普通教师居住的学校:超越怪物家长理论(第495期)“代课班主任”盛行的时代(五)从城市到全国
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    DENG Huaijin;UTSURO Takehito;KOBAYASHI Akio;NISHIZAKI Hiromitsu;小野田正利
  • 通讯作者:
    小野田正利

NISHIZAKI Hiromitsu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('NISHIZAKI Hiromitsu', 18)}}的其他基金

A Technology Transfer System based on Creation of Work Records and Procedures using Speech and Language Processing Technologies
基于使用语音和语言处理技术创建工作记录和程序的技术转让系统
  • 批准号:
    17H01977
  • 财政年份:
    2017
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Study on an Electronic Note-Taking Support System using Speech and Language Processing Technologies
利用语音和语言处理技术的电子笔记支持系统的研究
  • 批准号:
    26282049
  • 财政年份:
    2014
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Development of training system for improving the manner of speaking on lecture speech using speech processing technologies
利用语音处理技术开发提高演讲演讲方式的培训系统
  • 批准号:
    21700807
  • 财政年份:
    2009
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)

相似海外基金

脳神経疾患による構音障害を克服するための,音声認識および音声合成AIシステムの開発
开发语音识别与语音合成AI系统,克服脑神经疾病引起的构音障碍
  • 批准号:
    24K10630
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    23K23017
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
画像・音声認識と料理データベースによる食事記録システム開発、及び疫学研究での応用
基于图像/语音识别和烹饪数据库的用餐记录系统的开发及其在流行病学研究中的应用
  • 批准号:
    23K20170
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
非母語話者のスマートフォン音声認識機能での誤認識傾向を考慮した発音学習システム
使用智能手机语音识别功能,考虑到非母语人士的误识别倾向的发音学习系统。
  • 批准号:
    24K06231
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識を利用したbilingual speech-to-textシステム構築と授業分析への応用
自动语音识别双语语音转文本系统的构建及其在课程分析中的应用
  • 批准号:
    24K04125
  • 财政年份:
    2024
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
実用性の高いEnd-to-End音声認識に向けた研究
高实用性端到端语音识别研究
  • 批准号:
    22KJ2898
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
音声認識のデータ拡張のための音声合成との密統合
与语音合成紧密集成,用于语音识别的数据增强
  • 批准号:
    23K16944
  • 财政年份:
    2023
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
画像認識と音声認識の複合AIによる災害状況認識ユニットの基礎研究
图像识别与语音识别相结合的AI灾情识别单元基础研究
  • 批准号:
    22H01749
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
日常生活音を活用した構音障害者のための音響監視および音声認識システムの研究
使用日常声音对构音障碍患者进行声学监测和语音识别系统的研究
  • 批准号:
    22K12168
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
自動音声認識と機械学習による新たな医学教育システムの創出
使用自动语音识别和机器学习创建新的医学教育系统
  • 批准号:
    22K10459
  • 财政年份:
    2022
  • 资助金额:
    $ 2.66万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了