III: Small: A Query System for Rapid Audiovisual Analysis of Large-Scale Video Collections

三:小型:大规模视频采集快速视听分析的查询系统

基本信息

  • 批准号:
    1908727
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-09-01 至 2022-08-31
  • 项目状态:
    已结题

项目摘要

Due to advances in computer vision and audio processing, it is now possible to automatically annotate large video collections with basic information about their audiovisual contents (e.g., people, places, objects, audio transcripts). However, it remains difficult to productively carry out higher level analytics tasks on video because of the challenges of defining higher level, complex events of interest. In response, this project seeks to enable more sophisticated and higher productivity video analysis through the design of a programming system for composing basic video annotations into higher level patterns and events of interest in a video. Queries authored in the proposed system can serve as a direct specification of video events of interest, or as a mechanism for automatically generating data labels that provide supervision for subsequent model training. The proposed systems will be applicable to many video domains; however, the project will feature a collaboration with journalists and news media personnel to conduct an audiovisual analysis that measures diversity and representation in nearly a decade of American cable TV news broadcasts (over 200,000 hours since 2010). Specifically, the project will create software tools for answering questions such as: What individuals appear most often on the news? In what contexts? (in interviews? on panels?) What topics and stories do certain individuals cover? In addition to disseminating the results of these analyses, the project will produce interactive web-based tools that will enable students and the public to perform their own diversity analyses of the contents of cable TV news.The primary technical challenge of the project involves the design of a new video analysis system for defining spatio-temporal patterns and events of interest in video. Inspired by early multimedia database query systems, the system will support multi-modal video analyses by representing all video annotations (whether they result from pixels, audio, or transcripts) as continuous space-time volumes in a video. Users will define complex patterns via queries that compose (via spatio-temporal relations) and manipulate collections of simpler space-time annotations. The compositional nature of these queries will allow them to execute rapidly on large video collections, enabling analysts to iteratively conceptualize, prototype, and specify novel high-level patterns in videos. To reduce the cost of annotating large video collections, the project will also exploit the long running nature of TV and film video streams to train low-cost models that are specific to a show or film's video content. The project will investigate the use model distillation (and do so in a continuous, online setting) to train face and object detection models that maintain high accuracy on a video stream at an order of magnitude lower runtime cost than existing methods. All systems developed as part of the project will be distributed to the public as open source software, and the project will involve hosted hackathons to educate students and broader community about their use.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
由于计算机视觉和音频处理的进步,现在可以用关于其视听内容(例如,人、地点、物体、音频记录)的基本信息来自动地对大量视频集合进行注释。然而,由于定义更高级别、复杂的感兴趣事件的挑战,在视频上高效地执行更高级别的分析任务仍然很困难。作为回应,该项目寻求通过设计编程系统来实现更复杂和更高生产率的视频分析,以将基本视频注释组合成视频中更高级别的模式和感兴趣的事件。在所提出的系统中创作的查询可以用作感兴趣的视频事件的直接规范,或者用作自动生成数据标签的机制,该数据标签为后续的模型训练提供监督。拟议的系统将适用于许多视频领域;然而,该项目将与记者和新闻媒体工作人员合作,进行视听分析,衡量近十年来美国有线电视新闻广播的多样性和代表性(自2010年以来超过200 000小时)。具体地说,该项目将创建用于回答以下问题的软件工具:哪些人最常出现在新闻中?在什么情况下?(在采访中?在太阳能板上?)某些人报道哪些主题和故事?除了传播这些分析的结果外,该项目还将制作基于网络的互动工具,使学生和公众能够对有线电视新闻的内容进行自己的多样性分析。该项目的主要技术挑战涉及设计一种新的视频分析系统,以确定视频中的时空模式和感兴趣的事件。受早期多媒体数据库查询系统的启发,该系统将通过将所有视频注释(无论是来自像素、音频还是抄本)表示为视频中连续的时空卷来支持多模式视频分析。用户将通过组成(通过时空关系)和操作更简单的时空注释集合的查询来定义复杂的模式。这些查询的组合性质将允许它们在大型视频集合上快速执行,使分析师能够迭代地概念化视频中的新高级模式、原型并指定视频中的新高级模式。为了降低为大型视频集添加注释的成本,该项目还将利用电视和电影视频流的长期运行特性,培训特定于节目或电影视频内容的低成本模型。该项目将研究使用模型蒸馏(并在连续的在线设置中进行)来训练人脸和对象检测模型,这些模型以比现有方法低一个数量级的运行成本在视频流上保持高精度。作为该项目的一部分开发的所有系统将作为开源软件向公众分发,该项目将包括主办黑客松,以教育学生和更广泛的社区了解它们的使用。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Analysis of Faces in a Decade of US Cable TV News
美国有线电视新闻十年来的面孔分析
Spotting Temporally Precise, Fine-Grained Events in Video
  • DOI:
    10.48550/arxiv.2207.10213
  • 发表时间:
    2022-07
  • 期刊:
  • 影响因子:
    0
  • 作者:
    James Hong;Haotian Zhang;Michaël Gharbi;Matthew Fisher;Kayvon Fatahalian
  • 通讯作者:
    James Hong;Haotian Zhang;Michaël Gharbi;Matthew Fisher;Kayvon Fatahalian
Learning Rare Category Classifiers on a Tight Labeling Budget
Low-Shot Validation: Active Importance Sampling for Estimating Classifier Performance on Rare Categories
  • DOI:
    10.1109/iccv48922.2021.01053
  • 发表时间:
    2021-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Fait Poms;Vishnu Sarukkai;Ravi Teja Mullapudi;N. Sohoni;W. Mark;Deva Ramanan;Kayvon Fatahalian
  • 通讯作者:
    Fait Poms;Vishnu Sarukkai;Ravi Teja Mullapudi;N. Sohoni;W. Mark;Deva Ramanan;Kayvon Fatahalian
Background Splitting: Finding Rare Classes in a Sea of Background
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Kayvon Fatahalian其他文献

Fast and Three-rious: Speeding Up Weak Supervision with Triplet Methods
快速且三重:用三元组方法加速弱监督
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Daniel Y. Fu;Mayee F. Chen;Frederic Sala;Sarah Hooper;Kayvon Fatahalian;Christopher Ré
  • 通讯作者:
    Christopher Ré
Vid2Player: Controllable Video Sprites That Behave and Appear Like Professional Tennis Players
Vid2Player:行为和外观像职业网球运动员的可控视频精灵
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    6.2
  • 作者:
    Haotian Zhang;Cristobal Sciutto;Maneesh Agrawala;Kayvon Fatahalian
  • 通讯作者:
    Kayvon Fatahalian
Creating an Agile Hardware Design Flow
创建敏捷的硬件设计流程
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rick Bahr;Clark W. Barrett;Nikhil Bhagdikar;Alex Carsello;Ross G. Daly;Caleb Donovick;David Durst;Kayvon Fatahalian;Kathleen Feng;P. Hanrahan;Teguh Hofstee;M. Horowitz;Dillon Huff;Fredrik Kjolstad;Taeyoung Kong;Qiaoyi Liu;Makai Mann;J. Melchert;Ankita Nayak;Aina Niemetz;Gedeon Nyengele;Priyanka Raina;Stephen Richardson;Rajsekhar Setaluri;Jeff Setter;Kavya Sreedhar;Maxwell Strange;James J. Thomas;Christopher Torng;Lenny Truong;Nestan Tsiskaridze;Keyi Zhang
  • 通讯作者:
    Keyi Zhang
Type-directed scheduling of streaming accelerators
流加速器的类型定向调度
Finding Layers Using Hover Visualizations
使用悬停可视化查找图层
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Evan Shimizu;Matt Fisher;Sylvain Paris;Kayvon Fatahalian
  • 通讯作者:
    Kayvon Fatahalian

Kayvon Fatahalian的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Kayvon Fatahalian', 18)}}的其他基金

VEC: Small: Collaborative Research: The Visual Computing Database: A Platform for Visual Data Processing and Analysis at Internet Scale
VEC:小型:协作研究:视觉计算数据库:互联网规模的视觉数据处理和分析平台
  • 批准号:
    1539069
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
RI: Small: Using Prediction to Build a Compact Visual Memex Memory for Rapid Analysis and Understanding of Egocentric Video Data
RI:小型:使用预测构建紧凑的视觉 Memex 存储器,以快速分析和理解以自我为中心的视频数据
  • 批准号:
    1422767
  • 财政年份:
    2014
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
CAREER: Automatic Generation of High Efficiency Graphics Systems
职业:自动生成高效图形系统
  • 批准号:
    1253530
  • 财政年份:
    2013
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: Query-By-Sketch: Simplifying Video Clip Retrieval Through A Visual Query Paradigm
III:小:按草图查询:通过可视化查询范式简化视频剪辑检索
  • 批准号:
    2335881
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: RUI: Designing Structure-Phenotype Query-Retrieval and Analysis Systems for Microscopy-Based Whole Organism Studies
III:小:RUI:为基于显微镜的整个生物体研究设计结构表型查询检索和分析系统
  • 批准号:
    2401096
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Bringing database query optimization to data intensive applications
III:小型:将数据库查询优化引入数据密集型应用程序
  • 批准号:
    2008295
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: COMPASS: Online Sketch-based Query Optimization for In-Memory Databases
III:小:COMPASS:内存数据库基于草图的在线查询优化
  • 批准号:
    2008815
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Native Compilation, Query Processing, and Indexing for In-memory Graph Relational Data Systems
III:小:内存图关系数据系统的本机编译、查询处理和索引
  • 批准号:
    1910216
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Regret-Bounded Query Evaluation via Reinforcement Learning
III:小:通过强化学习进行遗憾限制查询评估
  • 批准号:
    1910830
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: RUI: Designing Structure-Phenotype Query-Retrieval and Analysis Systems for Microscopy-Based Whole Organism Studies
III:小:RUI:为基于显微镜的整个生物体研究设计结构表型查询检索和分析系统
  • 批准号:
    1817239
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: In-memory, Distributed, and Adaptive Spatio-textual Query Processing
III:小型:内存中、分布式和自适应空间文本查询处理
  • 批准号:
    1815796
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Non-Invasive Real-Time Analytics in Database Systems using Holistic Query Compilation
III:小型:使用整体查询编译在数据库系统中进行非侵入式实时分析
  • 批准号:
    1718582
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: Index Sharding and Query Routing in Distributed Search Engines
III:小:分布式搜索引擎中的索引分片和查询路由
  • 批准号:
    1718680
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了