Content Retrieval against large-scale spoken documents based on the integration of speech and language processing
基于语音和语言处理集成的大规模语音文档内容检索
基本信息
- 批准号:22500090
- 负责人:
- 金额:$ 2.83万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2010
- 资助国家:日本
- 起止时间:2010 至 2012
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
We conducted the research and the development of spoken content retrieval targeting large-scale spoken documents. Firstly, for the spoken term detection (STD) task, which aimed to detect the position in a spoken document that a given term appeared at, we developed the method that did not require any detection threshold but, instead, outputted the candidates in increasing order of their plausibility. Finally, we achieved about 70 times faster detection at the almost same detection performance than the baseline continuous DP matching. Next, for the spoken content retrieval (SCR) task, which aimed to find the segment in a spoken document that was relevant to a given query topic represented in natural language, we developed the method robust for recognition errors and out-of-vocabularies (OOVs) that made use of STD as its preprocessing. We found that the proposed method was effective for the query including OOVs and worked complementally with the conventional SCR method, which made use of the large vocabulary continuous speech recognition (LVCSR), and that the combination of them improved the retrieval performance.
我们针对大规模的口语文档进行了口语内容检索的研究和开发。首先,对于口语术语检测(STD)任务,其目的是检测一个给定的术语出现在口语文档中的位置,我们开发的方法,不需要任何检测阈值,而是,输出的候选人在增加他们的可扩展性的顺序。最后,我们在几乎相同的检测性能下实现了比基线连续DP匹配快约70倍的检测。接下来,对于口语内容检索(SCR)任务,其目的是找到段在一个口语文档中,是相关的一个给定的查询主题表示在自然语言中,我们开发的方法鲁棒的识别错误和词汇表外(OOVs),利用STD作为其预处理。我们发现,所提出的方法是有效的查询,包括OOVs和工作的补充与传统的SCR方法,它利用了大词汇量连续语音识别(LVCSR),和它们的组合提高了检索性能。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
音声言語処理と自然言語処理
口语处理和自然语言处理
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:K. Bouyarmane;A. Kheddar;中川聖一,小林聡,峯松信明,宇津呂武仁,秋葉友良,北岡教英,山本幹雄,甲斐充彦,山本一公,土屋雅稔
- 通讯作者:中川聖一,小林聡,峯松信明,宇津呂武仁,秋葉友良,北岡教英,山本幹雄,甲斐充彦,山本一公,土屋雅稔
Language Modeling Approach for Retrieving Passages in Lecture Audio Data
用于检索讲座音频数据中的段落的语言建模方法
- DOI:
- 发表时间:2010
- 期刊:
- 影响因子:0
- 作者:Koichiro Honda;Tomoyoshi Akiba
- 通讯作者:Tomoyoshi Akiba
音声ドキュメント検索のための自発クエリの収録と検索性能評価
记录自发查询并评估音频文档检索的搜索性能
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:熊谷 良夫;仙波 雅也;鎌田 十三郎;小林大輔;林利信,菅原真司,石橋豊;大島翔,秋葉友良
- 通讯作者:大島翔,秋葉友良
音声ドキュメント検索:マルチメディアデータを対象とした音声言語情報検索
音频文档搜索:多媒体数据的音频语言信息搜索
- DOI:
- 发表时间:2013
- 期刊:
- 影响因子:0
- 作者:Jin D.;Tsuji T;田村一樹;秋葉友良
- 通讯作者:秋葉友良
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
AKIBA Tomoyosi其他文献
小学校のICT活用をモデルとした保育での取り組み
以小学使用信息通信技术为蓝本的儿童保育举措
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一;堀田博史・佐藤朝美・森田健宏 - 通讯作者:
堀田博史・佐藤朝美・森田健宏
幼児教育でのタブレット端末等の活用
幼儿教育中平板设备等的利用
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵 - 通讯作者:
堀田博史・佐藤朝美・中村恵
最近の音声言語処理研究の動向 - 筆者の音声認識、音声翻訳、話者認識の研究を中心として -
口语处理研究的最新动态 - 重点关注作者在语音识别、语音翻译、说话人识别方面的研究 -
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
SEKI Hiroshi;YAMAMOTO Kazumasa;AKIBA Tomoyosi;NAKAGAWA Seiichi;堀田博史・佐藤朝美・中村恵;中川聖一 - 通讯作者:
中川聖一
AKIBA Tomoyosi的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('AKIBA Tomoyosi', 18)}}的其他基金
Development of an universal open-domain question answering System that can give an answer to any type of real-world questions
开发通用开放域问答系统,可以回答任何类型的现实世界问题
- 批准号:
17500092 - 财政年份:2005
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
相似海外基金
グローバルコミュニケーションに資する大脳皮質の音声情報処理機能単位の解明
阐明有助于全球交流的大脑皮层声音信息处理功能单元
- 批准号:
24K15685 - 财政年份:2024
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
蝸牛神経核における音声情報処理機構の解明
阐明耳蜗核中的语音信息处理机制
- 批准号:
25462628 - 财政年份:2013
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
音声の絶対的特徴と相対的特徴を融合した頑健で柔軟な音声情報処理技術の構築
构建鲁棒灵活的语音信息处理技术,结合语音的绝对特征和相对特征
- 批准号:
11J08960 - 财政年份:2011
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
乳児の音声情報処理の発達と言語獲得:事象関連電位による研究
婴儿语音信息处理和语言习得的发展:使用事件相关电位的研究
- 批准号:
07J01902 - 财政年份:2007
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for JSPS Fellows
音声情報処理技術を活用したマルチモーダルボイストレーニング支援システム
利用语音信息处理技术的多模态语音训练支持系统
- 批准号:
16700172 - 财政年份:2004
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
- 批准号:
16016219 - 财政年份:2004
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
人間による音声情報処理過程の分析とそれを応用した音声対話インターフェイスの構築
分析人类语音信息处理过程并利用该分析构建语音对话界面
- 批准号:
15017225 - 财政年份:2003
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Scientific Research on Priority Areas
音声情報処理技術を応用した弁別素性の音響及び聴覚的側面に関する基礎的研究
应用语音信息处理技术的判别特征声学和听觉方面的基础研究
- 批准号:
14651094 - 财政年份:2002
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Exploratory Research
障害幼児の音声情報処理と動作表現との関連性の解明
阐明残疾儿童言语信息处理与动作表达之间的关系
- 批准号:
07710215 - 财政年份:1995
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
障害幼児の音声情報処理と言語発達過程の解明
阐明残疾儿童的言语信息处理和语言发展过程
- 批准号:
06710183 - 财政年份:1994
- 资助金额:
$ 2.83万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)