SBIR Phase I: Tools for Information Retrieval and Document Classification Using Fast Phonetic Word-Spotting Technology
SBIR 第一阶段:使用快速语音单词识别技术的信息检索和文档分类工具
基本信息
- 批准号:0441492
- 负责人:
- 金额:$ 10万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2005
- 资助国家:美国
- 起止时间:2005-01-01 至 2005-06-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This Small Business Innovation Research Phase I research project will perform the research and development necessary to greatly enhance the information retrieval capability of a fast phonetic word-spotter. The completed research will lead to new methods for spoken document retrieval and classification on low quality telephony audio or multimedia digital sources. Spoken document retrieval has been a well-researched problem in the domain of broadcast news. However, many applications exist where users must retrieve and classify documents with lower quality audio. The most commonly applied method involves converting an audio stream or file into a hypothesized sequence of words (Speech-to-Text or STT), and subsequently using text- based information retrieval. Although this has been shown to be effective for broadcast news document retrieval, this has drawbacks. For example, STT's explicit use of language models limits the hypothesized word sequences to those within its lexicon. On the other hand, phonetic matching is capable of identifying likely instances of keywords, such as names, which are not in a lexicon. One advantage of the STT approach is the applicability of text-based information retrieval methods, which work well on high quality audio where the error rates are fairly small. However, better solutions are necessary over a high volume telephony channel where the computational burden and low accuracy make STT impractical. The goal of the proposed project is to research and develop phonetic-based document retrieval and classification algorithms. The applicability of retrieval systems based on phonetic searches will be compared on large existing corpora.The key innovation of the proposed research is to adapt search techniques to function in environments where audio exists, but text does not. Scientifically, algorithms must be made to work in a probabilistic framework, since phonetic word spotting is always based on confidence measures. Commercially, existing multimedia or audio archives will be available for data mining. In addition, decisions of document type (e.g., was the phone call to the call center a complaint?) open commercial applications in market intelligence, security analysis, quality analysis, and any call segregation application.
这个小型企业创新研究第一阶段的研究项目将进行必要的研究和开发,以大大提高快速语音单词识别器的信息检索能力。完成的研究将为低质量电话音频或多媒体数字源的语音文档检索和分类提供新的方法。语音文档检索一直是广播新闻领域研究的热点问题。然而,在许多应用程序中,用户必须检索和分类质量较低的音频文档。最常用的方法包括将音频流或文件转换为假设的单词序列(语音到文本或STT),然后使用基于文本的信息检索。尽管这已被证明对广播新闻文档检索是有效的,但它也有缺点。例如,STT对语言模型的明确使用将假设的单词序列限制为其词典中的那些。另一方面,语音匹配能够识别词典中不存在的关键字的可能实例,例如名称。STT方法的一个优点是基于文本的信息检索方法的适用性,这种方法在错误率相当小的高质量音频上工作得很好。然而,在高容量的电话信道中,更好的解决方案是必要的,因为计算负担和低精度使得STT不切实际。该计划的目标是研究和开发基于语音的文档检索和分类算法。在现有的大型语料库上比较基于语音搜索的检索系统的适用性。所提出的研究的关键创新是使搜索技术适应音频存在而文本不存在的环境。科学地说,算法必须在概率框架中工作,因为语音单词识别总是基于置信度度量。商业上,现有的多媒体或音频档案将可用于数据挖掘。此外,文档类型的决定(例如,呼叫中心的电话是否为投诉?)在市场情报、安全分析、质量分析和任何呼叫隔离应用程序中开放商业应用程序。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Robert Morris其他文献
Peer–to–Peer Overlays: Issues and Trends
点对点覆盖:问题和趋势
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Arockia Mary M. Radhakrishnan;E. Lua;J. Crowcroft;M. Pias;Ravi Sharma;Steven Lim;Timo Tanner;J. Buford;Heather Yu;Eng Keong Lua quotP2P;Karl Aberer;M. Hauswirth;Ion Stoica;Robert Morris;David Karger;M. Kaashoek;Hari Balakrishnan;Jessie Hui Wang;Chungang Wang;Jiahai Yang;Hiroshi Nishida;Thinh Nguyen;Murat Karakaya;I. Korpeoglu - 通讯作者:
I. Korpeoglu
The cost of convenience: Fellow and program director perspectives on the adequacy of virtual fellowship interviews as a replacement for in-person interviews (2317)
便利性的代价:研究员和项目主任对虚拟研究员面试作为面对面面试替代品的充分性的看法(2317)
- DOI:
10.1016/j.ygyno.2023.06.434 - 发表时间:
2023-09-01 - 期刊:
- 影响因子:4.100
- 作者:
Larissa Mattei;Madison Miller;Lauren Robb;Rosa Polan;Radhika Gogoi;Robert Morris - 通讯作者:
Robert Morris
Prevalence of targetable and potentially targetable alterations in metastatic/recurrent cervical cancer specimens in a large genomic dataset
在一个大型基因组数据集中转移性/复发性宫颈癌样本中可靶向和潜在可靶向改变的流行率
- DOI:
10.1016/j.ygyno.2024.07.337 - 发表时间:
2024-11-01 - 期刊:
- 影响因子:4.100
- 作者:
John Wallbillich;Sami Nassar;Michael Wilson;Larissa Mattei;Elizabeth Johns;Radhika Gogoi;Robert Morris;Ira Winer - 通讯作者:
Ira Winer
Double Opposing Zplasty with VY Advancement of the perineum: Long-term results of a new technique as an alternative to Fenton’s operation for narrowing and splitting of the skin at the posterior vaginal fourchette
- DOI:
10.1016/j.ejogrb.2018.02.003 - 发表时间:
2018-04-01 - 期刊:
- 影响因子:
- 作者:
Jonathan Frappell;Lia Riadin;Elhami Ebeid;Tilo Asmussen;Robert Morris - 通讯作者:
Robert Morris
Disease site matters: Ovarian carcinosarcoma has far more genomic similarity to high-grade serous ovarian carcinoma than to uterine carcinosarcoma
- DOI:
10.1016/s0090-8258(21)00894-5 - 发表时间:
2021-08-01 - 期刊:
- 影响因子:
- 作者:
Christopher Walker;Erin Spencer;Gregory Dyson;Rouba Ali-Fehmi;Ira Winer;Michele Cote;Robert Morris;John Wallbillich - 通讯作者:
John Wallbillich
Robert Morris的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Robert Morris', 18)}}的其他基金
Collaborative Research: Drivers and effects of latent phage activation in marine SAR11
合作研究:海洋 SAR11 中潜在噬菌体激活的驱动因素和影响
- 批准号:
2201310 - 财政年份:2022
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CSR: Medium: Collaborative Research: Soup: Flexible Storage and Processing for On-Line Applications
CSR:媒介:协作研究:汤:在线应用程序的灵活存储和处理
- 批准号:
1704172 - 财政年份:2018
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
CSR: Small: Operating Systems Kernels in High-Level Languages
CSR:小:高级语言的操作系统内核
- 批准号:
1617487 - 财政年份:2016
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
Characterizing the contribution of bacteria from the SUP05 clade to autotrophic and heterotrophic carbon cycling across ocean gradients
表征 SUP05 进化枝细菌对跨海洋梯度自养和异养碳循环的贡献
- 批准号:
1558483 - 财政年份:2016
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
Mixotrophic bacteria and the cryptic marine sulfur cycle: Mechanisms of carbon assimilation and sulfur oxidation in the Arctic96BD-19 GSO clade
混合营养细菌和神秘的海洋硫循环:北极96BD-19 GSO进化枝的碳同化和硫氧化机制
- 批准号:
1232840 - 财政年份:2012
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
Program Development in Cybersecurity with Focus on Business and Healthcare Concepts
以商业和医疗保健概念为重点的网络安全项目开发
- 批准号:
1104106 - 财政年份:2011
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
CSR-PSCE, SM: An Operating System for Multi-core Processors
CSR-PSCE、SM:多核处理器操作系统
- 批准号:
0834415 - 财政年份:2008
- 资助金额:
$ 10万 - 项目类别:
Continuing Grant
NeTS-FIND: User Information Architecture
NeTS-FIND:用户信息架构
- 批准号:
0627065 - 财政年份:2006
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
SEI(BIO)+II: Metadata-rich Image Databases for Biodiversity Applications
SEI(BIO) II:用于生物多样性应用的元数据丰富的图像数据库
- 批准号:
0430769 - 财政年份:2004
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
SBIR Phase I: Collaborative Product Definition Management
SBIR 第一阶段:协作产品定义管理
- 批准号:
0339708 - 财政年份:2004
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
相似国自然基金
Baryogenesis, Dark Matter and Nanohertz Gravitational Waves from a Dark
Supercooled Phase Transition
- 批准号:24ZR1429700
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
ATLAS实验探测器Phase 2升级
- 批准号:11961141014
- 批准年份:2019
- 资助金额:3350 万元
- 项目类别:国际(地区)合作与交流项目
地幔含水相Phase E的温度压力稳定区域与晶体结构研究
- 批准号:41802035
- 批准年份:2018
- 资助金额:12.0 万元
- 项目类别:青年科学基金项目
基于数字增强干涉的Phase-OTDR高灵敏度定量测量技术研究
- 批准号:61675216
- 批准年份:2016
- 资助金额:60.0 万元
- 项目类别:面上项目
基于Phase-type分布的多状态系统可靠性模型研究
- 批准号:71501183
- 批准年份:2015
- 资助金额:17.4 万元
- 项目类别:青年科学基金项目
纳米(I-Phase+α-Mg)准共晶的临界半固态形成条件及生长机制
- 批准号:51201142
- 批准年份:2012
- 资助金额:25.0 万元
- 项目类别:青年科学基金项目
连续Phase-Type分布数据拟合方法及其应用研究
- 批准号:11101428
- 批准年份:2011
- 资助金额:23.0 万元
- 项目类别:青年科学基金项目
D-Phase准晶体的电子行为各向异性的研究
- 批准号:19374069
- 批准年份:1993
- 资助金额:6.4 万元
- 项目类别:面上项目
相似海外基金
SBIR Phase II: Predictive Tools for Characterizing Carbon Sequestration in Mined Materials
SBIR 第二阶段:用于表征开采材料中碳封存的预测工具
- 批准号:
2212919 - 财政年份:2023
- 资助金额:
$ 10万 - 项目类别:
Cooperative Agreement
SBIR Phase I: Predictive Tools for Characterizing Carbon Sequestration in Mined Materials
SBIR 第一阶段:用于表征开采材料中碳封存的预测工具
- 批准号:
2035430 - 财政年份:2021
- 资助金额:
$ 10万 - 项目类别:
Standard Grant
SBIR PHASE I - TOPIC 426 - TOOLS AND TECHNOLOGIES FOR VISUALIZING MULTI-SCALE DATA
SBIR 第一阶段 - 主题 426 - 多尺度数据可视化工具和技术
- 批准号:
10494301 - 财政年份:2021
- 资助金额:
$ 10万 - 项目类别:
SBIR PHASE I - TOPIC 426 - TOOLS AND TECHNOLOGIES FOR VISUALIZING MULTI-SCALE DATA
SBIR 第一阶段 - 主题 426 - 多尺度数据可视化工具和技术
- 批准号:
10494300 - 财政年份:2021
- 资助金额:
$ 10万 - 项目类别:
SBIR PHASE I- TOPIC 410 - CANCER CLINICAL TRIALS RECRUITMENT AND RETENTION TOOLS FOR PARTICIPANT ENGAGEMENT.
SBIR 第一阶段 - 主题 410 - 癌症临床试验招募和保留参与者参与的工具。
- 批准号:
10269299 - 财政年份:2020
- 资助金额:
$ 10万 - 项目类别:
SBIR Phase II: Innovative software and database tools for targeted genomics
SBIR 第二阶段:用于靶向基因组学的创新软件和数据库工具
- 批准号:
2025936 - 财政年份:2020
- 资助金额:
$ 10万 - 项目类别:
Cooperative Agreement
SBIR Phase I Topic 410 - Cancer Clinical Trials Recruitment and Retention Tools for Participant Engagement.
SBIR 第一阶段主题 410 - 用于参与者参与的癌症临床试验招募和保留工具。
- 批准号:
10265761 - 财政年份:2020
- 资助金额:
$ 10万 - 项目类别:
TOPIC #411 - PHASE I SBIR CONTRACT - DE-IDENTIFICATION SOFTWARE TOOLS FOR CANCER IMAGING RESEARCH
话题
- 批准号:
10274086 - 财政年份:2020
- 资助金额:
$ 10万 - 项目类别:
SBIR Phase I- Topic 410 - Cancer Clinical Trials Recruitment and Retention Tools for Participant Engagement.
SBIR 第一阶段 - 主题 410 - 用于参与者参与的癌症临床试验招募和保留工具。
- 批准号:
10265762 - 财政年份:2020
- 资助金额:
$ 10万 - 项目类别:
SBIR PHASE I- TOPIC 410 - CANCER CLINICAL TRIALS RECRUITMENT AND RETENTION TOOLS FOR PARTICIPANT ENGAGEMENT.
SBIR 第一阶段 - 主题 410 - 癌症临床试验招募和保留参与者参与的工具。
- 批准号:
10269289 - 财政年份:2020
- 资助金额:
$ 10万 - 项目类别: