I-Corps: Semantic Video - from Video to Descriptions

I-Corps:语义视频 - 从视频到描述

基本信息

  • 批准号:
    1647887
  • 负责人:
  • 金额:
    $ 5万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2016
  • 资助国家:
    美国
  • 起止时间:
    2016-08-15 至 2017-07-31
  • 项目状态:
    已结题

项目摘要

The broader impact/commercial potential of this I-Corps project involves computer vision analysis of video, using both visual and auditory cues, to create descriptions of the content. The technology has a large variety of potential applications from law enforcement to surveillance to consumer applications. These include enabling the efficient storage and retrieval of large volumes of camera data. Smart surveillance systems can be enhanced with features that allows for summarization of daylong video footages as a list of security-relevant events. The technology can also allow automated organization of large collections of multimedia data.This I-Corps project involves commercialization feasibility research for a computer vision technology for expressing video content in terms of natural language text and grammar, i.e. semantics. This project builds on a video analysis framework that leverages state-of-the-art methods for object detection and action recognition in a unified formalism encoded in terms of a mathematical and statistical approach known as pattern theory. The video analysis approach can (i) handle structural variability of complex events without requiring large training data while exploiting easily available ontological information, (ii) overcome classification errors of machine learning classifiers of actions and objects, (iii) accommodate scene clutter, i.e. extraneous objects that do not in the activity present in the scene, (iv) and manage sequences of elementary events, all without retraining. The formalism allows for the easy incorporation of temporal, spatial, and logical constraints. This team has demonstrated this system on standard datasets used to benchmark performance in computer vision for human activity recognition tasks.
这个i-Corps项目的更广泛的影响/商业潜力涉及到计算机视觉分析视频,使用视觉和听觉线索来创建内容的描述。这项技术具有从执法到监控再到消费者应用的大量潜在应用。其中包括实现大量相机数据的高效存储和检索。智能监控系统可以通过允许将一整天的视频片段汇总为与安全相关的事件列表的功能来增强。该技术还可以自动组织大量多媒体数据。这个I-Corps项目涉及计算机视觉技术的商业化可行性研究,以自然语言文本和语法,即语义来表达视频内容。这个项目建立在一个视频分析框架的基础上,该框架利用最先进的方法,以一种被称为模式理论的数学和统计方法对统一的形式主义进行编码,用于对象检测和动作识别。视频分析方法可以(I)在利用容易获得的本体论信息的同时不需要大量训练数据来处理复杂事件的结构可变性,(Ii)克服动作和对象的机器学习分类器的分类错误,(Iii)适应场景杂乱,即不在场景中存在的活动中的无关对象,(Iv)并且管理基本事件的序列,所有这些都不需要重新训练。形式主义允许轻松地合并时间、空间和逻辑约束。该团队已经在标准数据集上演示了这一系统,该数据集用于对人类活动识别任务的计算机视觉性能进行基准测试。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sudeep Sarkar其他文献

Mixing Properties of Stable Random Fields Indexed by Amenable and Hyperbolic Groups
由顺从群和双曲群索引的稳定随机场的混合特性
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mahan Mj;Parthanil Roy;Sudeep Sarkar
  • 通讯作者:
    Sudeep Sarkar
A modeling approach for burn scar assessment using natural features and elastic property
利用自然特征和弹性特性进行烧伤疤痕评估的建模方法
  • DOI:
    10.1109/tmi.2004.834625
  • 发表时间:
    2004
  • 期刊:
  • 影响因子:
    10.6
  • 作者:
    Yong Zhang;Dmitry Goldgof;Sudeep Sarkar;L. Tsap
  • 通讯作者:
    L. Tsap
A sensitivity analysis method and its application in physics-based nonrigid motion modeling
灵敏度分析方法及其在物理非刚体运动建模中的应用
  • DOI:
    10.1016/j.imavis.2005.08.007
  • 发表时间:
    2007
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yong Zhang;Dmitry Goldgof;Sudeep Sarkar;L. Tsap
  • 通讯作者:
    L. Tsap
Efficient Generation of Large Amounts of Training Data for Sign Language Recognition: A Semi-automatic Tool
高效生成大量手语识别训练数据:半自动工具
  • DOI:
    10.1007/11788713_94
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ruiduo Yang;Sudeep Sarkar;B. Loeding;A. Karshmer
  • 通讯作者:
    A. Karshmer
Different atom trapping geometries with time averaged adiabatic potentials
具有时间平均绝热势的不同原子捕获几何结构
  • DOI:
    10.1140/epjd/s10053-021-00290-6
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Sudeep Sarkar;S. P. Ram;V. B. Tiwari;S. Mishra
  • 通讯作者:
    S. Mishra

Sudeep Sarkar的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sudeep Sarkar', 18)}}的其他基金

Collaborative Research: RI:Medium:Understanding Events from Streaming Video - Joint Deep and Graph Representations, Commonsense Priors, and Predictive Learning
协作研究:RI:Medium:理解流视频中的事件 - 联合深度和图形表示、常识先验和预测学习
  • 批准号:
    1956050
  • 财政年份:
    2020
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
I-Corps Sites: Type II - I-Corps Site at University of South Florida Tampa
I-Corps 站点:II 型 - 南佛罗里达大学坦帕分校 I-Corps 站点
  • 批准号:
    1829217
  • 财政年份:
    2018
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
I-Corps Sites: University of South Florida: Catalyzing Research Translation
I-Corps 网站:南佛罗里达大学:促进研究成果转化
  • 批准号:
    1449137
  • 财政年份:
    2015
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
RI: Small: Collaborative Research: Ontology based Perceptual Organization of Audio-Video Events using Pattern Theory
RI:小型:协作研究:使用模式理论对音频-视频事件进行基于本体的感知组织
  • 批准号:
    1217676
  • 财政年份:
    2012
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant
EMT/Nano: Energy Minimization Computing using Field Coupled Nanomagnets--Modeling and Fabrication
EMT/Nano:使用场耦合纳米磁体的能量最小化计算——建模和制造
  • 批准号:
    0829838
  • 财政年份:
    2008
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant
ITR: Fundamental Issues in Automated American Sign Language Recognition
ITR:美国手语自动识别的基本问题
  • 批准号:
    0312993
  • 财政年份:
    2003
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
CISE Research Resources: A Compute-Intensive Sensor-Based Environment for Research in Computer Vision and Artificial Intelligence
CISE 研究资源:用于计算机视觉和人工智能研究的基于计算密集型传感器的环境
  • 批准号:
    0130768
  • 财政年份:
    2001
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant
Enhancing Undergraduate Computer Science Curriculum through Image Computations: Proof-of-Concept
通过图像计算加强本科计算机科学课程:概念验证
  • 批准号:
    9980832
  • 财政年份:
    2000
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant
The Role Learning in Perceptual Organization of Complex Images
复杂图像感知组织中的角色学习
  • 批准号:
    9907141
  • 财政年份:
    1999
  • 资助金额:
    $ 5万
  • 项目类别:
    Continuing Grant
Major Research Instrumentation: Acquisition of a Cyberware 3D Scanner to Facilitate State of Art Research in Computer Vision and Graphics
主要研究仪器:购买 Cyber​​ware 3D 扫描仪以促进计算机视觉和图形领域的最先进研究
  • 批准号:
    9724422
  • 财政年份:
    1997
  • 资助金额:
    $ 5万
  • 项目类别:
    Standard Grant

相似海外基金

Video Semantic Segmentation and Tracking in Low Light Videos
低光视频中的视频语义分割和跟踪
  • 批准号:
    2894985
  • 财政年份:
    2023
  • 资助金额:
    $ 5万
  • 项目类别:
    Studentship
Web-Scale Semantic Image and Video Understanding
网络规模的语义图像和视频理解
  • 批准号:
    RGPIN-2018-04657
  • 财政年份:
    2022
  • 资助金额:
    $ 5万
  • 项目类别:
    Discovery Grants Program - Individual
Web-Scale Semantic Image and Video Understanding
网络规模的语义图像和视频理解
  • 批准号:
    RGPIN-2018-04657
  • 财政年份:
    2021
  • 资助金额:
    $ 5万
  • 项目类别:
    Discovery Grants Program - Individual
Video-based semantic analysis for on crowded rail stations
基于视频的拥挤火车站语义分析
  • 批准号:
    971717
  • 财政年份:
    2020
  • 资助金额:
    $ 5万
  • 项目类别:
    Small Business Research Initiative
Web-Scale Semantic Image and Video Understanding
网络规模的语义图像和视频理解
  • 批准号:
    RGPIN-2018-04657
  • 财政年份:
    2020
  • 资助金额:
    $ 5万
  • 项目类别:
    Discovery Grants Program - Individual
Web-Scale Semantic Image and Video Understanding
网络规模的语义图像和视频理解
  • 批准号:
    RGPIN-2018-04657
  • 财政年份:
    2019
  • 资助金额:
    $ 5万
  • 项目类别:
    Discovery Grants Program - Individual
Web-Scale Semantic Image and Video Understanding
网络规模的语义图像和视频理解
  • 批准号:
    522579-2018
  • 财政年份:
    2019
  • 资助金额:
    $ 5万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Web-Scale Semantic Image and Video Understanding
网络规模的语义图像和视频理解
  • 批准号:
    RGPIN-2018-04657
  • 财政年份:
    2018
  • 资助金额:
    $ 5万
  • 项目类别:
    Discovery Grants Program - Individual
Web-Scale Semantic Image and Video Understanding
网络规模的语义图像和视频理解
  • 批准号:
    522579-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 5万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Deep semantic annotation of video contents
视频内容的深度语义标注
  • 批准号:
    17H01831
  • 财政年份:
    2017
  • 资助金额:
    $ 5万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了