SBIR Phase I: Real-time, accurate OCR from Video using Intra- and Inter-Frame Machine Learning

SBIR 第一阶段:使用帧内和帧间机器学习对视频进行实时、准确的 OCR

基本信息

  • 批准号:
    0810693
  • 负责人:
  • 金额:
    $ 10万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2008
  • 资助国家:
    美国
  • 起止时间:
    2008-07-01 至 2008-12-31
  • 项目状态:
    已结题

项目摘要

This Small Business Innovation Research (SBIR) Phase I research project focusses on the development of ground-breaking real-time algorithms for automatically finding and recognizing text in digital video of complex 3-D environments using machine learning of fonts and text strings. Essentially, the project takes OCR from being a technology for 2-D documents and brings it to the 3-D world. The project builds on algorithms for optical character recognition (OCR) of documents where conventional OCR fails: colorful brochures, magazine covers, and other sources where photographs, line art, and arbitrarily-rotated text greatly complicate the OCR process. The project aims to build on this technology to find solutions to the finding and recognizing text in complex 3-D real world scenes such as street signs and storefronts where the text may be at any arbitrary 3-D angle to the camera. Critical to the success of this project is the algorithm's capability for machine learning of fonts. There are a number of exciting applications that are impacted by accurate OCR from video sources. While OCR of text in video sources can be done, it usually must be on plainly obvious text, such as subtitles, and it cannot be done in real-time. Real-time and accurate video OCR would enable applications that include 1) Unaided indexing of digital video footage by the text contained therein, 2) aiding the blind navigate independently, both indoors and outdoors, 3) automated continuous roadside or vehicle based license plate scanning, and 4) as ground truth for improved GPS accuracy. Markets for the technology therefore include individuals, corporations, and government agencies. The societal impacts include 1) rendering digitized video libraries searchable by more metadata tags at low cost, 2) greater independence and safety for the blind, 3) improving road safety through automatically identifying cars reported stolen or cars owned by people with suspended licenses, and 4) improved GPS navigation accuracy. Technological impacts will be in the areas of machine learning applied to video OCR, real-time OCR, and low-resolution OCR.
这个小型企业创新研究(SBIR)第一阶段研究项目的重点是开发突破性的实时算法,用于使用字体和文本字符串的机器学习来自动查找和识别复杂3D环境中的数字视频中的文本。从本质上讲,该项目将OCR从2D文档的技术带到了3D世界。该项目建立在光学字符识别(OCR)的算法之上,传统OCR无法识别的文档包括彩色小册子、杂志封面以及其他来源,其中照片、线条艺术和任意旋转的文本使OCR过程变得非常复杂。该项目旨在建立在这项技术的基础上,找到在复杂的3-D真实的世界场景中寻找和识别文本的解决方案,例如街道标志和店面,其中文本可能与摄像机成任意3-D角度。该项目成功的关键是该算法的字体机器学习能力。有许多令人兴奋的应用程序受到来自视频源的准确OCR的影响。虽然可以对视频源中的文本进行OCR,但它通常必须针对明显的文本,例如字幕,并且不能实时完成。实时和准确的视频OCR将使应用包括:1)通过数字视频片段中包含的文本对数字视频片段进行无辅助索引,2)帮助盲人在室内和室外独立导航,3)自动连续的路边或基于车辆的车牌扫描,以及4)作为地面实况以提高GPS精度。因此,该技术的市场包括个人、公司和政府机构。社会影响包括:1)使数字化视频库可通过更多元数据标签以低成本进行搜索,2)盲人的独立性和安全性更高,3)通过自动识别报告被盗的汽车或被吊销执照的人拥有的汽车来改善道路安全,以及4)提高GPS导航精度。技术影响将出现在应用于视频OCR、实时OCR和低分辨率OCR的机器学习领域。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ari Gross其他文献

Pictures and pedagogy: The role of diagrams in Feynman's early lectures
  • DOI:
    10.1016/j.shpsb.2012.04.001
  • 发表时间:
    2012-08-01
  • 期刊:
  • 影响因子:
  • 作者:
    Ari Gross
  • 通讯作者:
    Ari Gross
Museums and scientific material culture at the University of Toronto
  • DOI:
    10.1016/j.shpsa.2013.07.015
  • 发表时间:
    2013-12-01
  • 期刊:
  • 影响因子:
  • 作者:
    Erich Weidenhammer;Ari Gross
  • 通讯作者:
    Ari Gross

Ari Gross的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ari Gross', 18)}}的其他基金

SBIR Phase II: Real-time, Accurate OCR from Documents using Intra- and Inter-Frame Machine Learning
SBIR 第二阶段:使用帧内和帧间机器学习对文档进行实时、准确的 OCR
  • 批准号:
    0924549
  • 财政年份:
    2009
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SGER: Developing a Non-parametric Digital Image Search Engine
SGER:开发非参数数字图像搜索引擎
  • 批准号:
    9707090
  • 财政年份:
    1997
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
Non-Parametric Shape Recovery for Computer Vision
计算机视觉的非参数形状恢复
  • 批准号:
    9302041
  • 财政年份:
    1993
  • 资助金额:
    $ 10万
  • 项目类别:
    Continuing Grant

相似国自然基金

Baryogenesis, Dark Matter and Nanohertz Gravitational Waves from a Dark Supercooled Phase Transition
  • 批准号:
    24ZR1429700
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
ATLAS实验探测器Phase 2升级
  • 批准号:
    11961141014
  • 批准年份:
    2019
  • 资助金额:
    3350 万元
  • 项目类别:
    国际(地区)合作与交流项目
地幔含水相Phase E的温度压力稳定区域与晶体结构研究
  • 批准号:
    41802035
  • 批准年份:
    2018
  • 资助金额:
    12.0 万元
  • 项目类别:
    青年科学基金项目
基于数字增强干涉的Phase-OTDR高灵敏度定量测量技术研究
  • 批准号:
    61675216
  • 批准年份:
    2016
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于Phase-type分布的多状态系统可靠性模型研究
  • 批准号:
    71501183
  • 批准年份:
    2015
  • 资助金额:
    17.4 万元
  • 项目类别:
    青年科学基金项目
纳米(I-Phase+α-Mg)准共晶的临界半固态形成条件及生长机制
  • 批准号:
    51201142
  • 批准年份:
    2012
  • 资助金额:
    25.0 万元
  • 项目类别:
    青年科学基金项目
连续Phase-Type分布数据拟合方法及其应用研究
  • 批准号:
    11101428
  • 批准年份:
    2011
  • 资助金额:
    23.0 万元
  • 项目类别:
    青年科学基金项目
D-Phase准晶体的电子行为各向异性的研究
  • 批准号:
    19374069
  • 批准年份:
    1993
  • 资助金额:
    6.4 万元
  • 项目类别:
    面上项目

相似海外基金

SBIR Phase I: Testing computational feasibility and effectiveness of real time traffic nearcast for wildfire evacuation at the wildland urban interface
SBIR 第一阶段:测试荒地城市界面野火疏散实时交通近播的计算可行性和有效性
  • 批准号:
    2322210
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase II: A Blockchain Ecosystem for Encrypting Real World Data and Developing Artificial Intelligence to Optimize Pharmacy Prior Authorization
SBIR 第二阶段:用于加密现实世界数据和开发人工智能以优化药房预授权的区块链生态系统
  • 批准号:
    2200163
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Cooperative Agreement
SBIR Phase II: Real-time computer automated identification and quantification of insects entering the SolaRid insect control device (ICD)
SBIR 第二阶段:实时计算机自动识别和量化进入 SolaRid 昆虫控制装置 (ICD) 的昆虫
  • 批准号:
    2247237
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Cooperative Agreement
SBIR Phase I: Real-Time Allergen Detection Technology for Dietary Proteins Transferred to Human Milk
SBIR 第一阶段:转移到母乳中的膳食蛋白的实时过敏原检测技术
  • 批准号:
    2321861
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase I: Real-Time Artificial Intelligence (AI) Bidirectional American Sign Language (ASL) Communication System
SBIR第一阶段:实时人工智能(AI)双向美国手语(ASL)通信系统
  • 批准号:
    2213235
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase I: A real-time precision nutrient analysis and management system for hydroponic farming operations
SBIR 第一阶段:用于水培农业作业的实时精确养分分析和管理系统
  • 批准号:
    2210046
  • 财政年份:
    2023
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase I: Video-to-speech software application to provide real-time, noninvasive, natural voice restoration for voiceless individuals
SBIR 第一阶段:视频转语音软件应用程序,为失声者提供实时、无创、自然的语音恢复
  • 批准号:
    2136629
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase I: Wearable System for Stress Management via Real Time Stress Tracking and Biofeedback
SBIR 第一阶段:通过实时压力跟踪和生物反馈进行压力管理的可穿戴系统
  • 批准号:
    2212935
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase I: Haptic Glove for Real-Time Speech Comprehension
SBIR 第一阶段:用于实时语音理解的触觉手套
  • 批准号:
    2112296
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Standard Grant
SBIR Phase II: Estimating, Learning, and Optimizing Real-Time Grid Emissions
SBIR 第二阶段:估计、学习和优化实时电网排放
  • 批准号:
    2051953
  • 财政年份:
    2022
  • 资助金额:
    $ 10万
  • 项目类别:
    Cooperative Agreement
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了