Computer vision algorithms for live video processing using programmable graphics hardware
使用可编程图形硬件进行实时视频处理的计算机视觉算法
基本信息
- 批准号:293127-2012
- 负责人:
- 金额:$ 1.6万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2015
- 资助国家:加拿大
- 起止时间:2015-01-01 至 2016-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Today's technology is increasingly powerful and affordable. For example, an 800 dollar graphics card today can process one Trillion FLOPs in double precision. Merely a decade ago, such processing power would come with a one million dollar price tag. Similarly, digital video cameras at the time were only available to movie producers, whereas today they are in the hands of billions of users, as well as integrated into phones, vehicles, and game consoles. The availability of low cost processing power and digital video capturing devices allow computer vision techniques to affect and benefit our day to day lives. They are making our phones smarter, our vehicles safer, and our game consoles much more fun to interact with.
This research investigates how to perform challenging computer vision tasks on live video at real-time speed. The tasks include inferring depth from video sequences captured from different viewpoints (stereo vision), detecting moving foreground objects from dynamic backgrounds (foreground segmentation), and extracting objects with fuzzy boundaries for seamlessly blending with new backgrounds (video matting). Being able to perform these tasks for live video has a widely range of applications in our daily life. For example, real-time stereo vision can be employed for sensing the 3D environment and foreground segmentation for detecting pedestrians; both are key components of the future driverless cars. Foreground segmentation and video matting can be used to extract video conference participants from captured video and place them into the same virtual environment, providing better sense of presence and better protection of privacy.
The goal of the research is to develop novel algorithms that are not only fast enough for handling live video, but also having better or comparable performance to the state-of-the-art offline algorithms. The algorithms to be developed therefore need to be both effective and efficient. In addition, to harvest the processing power of modern graphics hardware, these algorithms will be designed with parallel execution in mind. Some preliminary work along this research direction has yielded very promising results.
今天的技术越来越强大,价格也越来越便宜。 例如,一个800美元的图形卡今天可以处理一个三进制浮点数在双精度。 仅仅在十年前,这样的处理能力还需要100万美元的价格。 同样,当时的数码摄像机仅适用于电影制片人,而今天它们掌握在数十亿用户手中,并集成到手机,车辆和游戏机中。 低成本处理能力和数字视频捕获设备的可用性使计算机视觉技术能够影响和造福我们的日常生活。 他们让我们的手机更智能,我们的汽车更安全,我们的游戏机更有趣的互动。
这项研究探讨了如何以实时速度在实时视频上执行具有挑战性的计算机视觉任务。 这些任务包括从不同视点捕获的视频序列中推断深度(立体视觉),从动态背景中检测移动的前景对象(前景分割),以及提取具有模糊边界的对象,以便与新背景无缝融合(视频抠图)。 能够为实时视频执行这些任务在我们的日常生活中有着广泛的应用。 例如,实时立体视觉可用于感知3D环境,前景分割可用于检测行人;两者都是未来无人驾驶汽车的关键组成部分。 前景分割和视频抠图可用于从捕获的视频中提取视频会议参与者,并将其放置到同一虚拟环境中,从而提供更好的存在感和更好的隐私保护。
该研究的目标是开发新型算法,不仅速度足够快,可以处理实时视频,而且具有比最先进的离线算法更好或相当的性能。 因此,要开发的算法需要既有效又高效。 此外,为了获得现代图形硬件的处理能力,这些算法将在设计时考虑到并行执行。 沿着这个研究方向的一些初步工作沿着已经取得了非常有希望的结果。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Gong, Minglun其他文献
Real-Time Discriminative Background Subtraction
- DOI:
10.1109/tip.2010.2087764 - 发表时间:
2011-05-01 - 期刊:
- 影响因子:10.6
- 作者:
Cheng, Li;Gong, Minglun;Caelli, Terry - 通讯作者:
Caelli, Terry
Edge-aware point resampling
边缘感知点重采样
- DOI:
- 发表时间:
- 期刊:
- 影响因子:6.2
- 作者:
Huang, Hui;Wu, Shihao;Gong, Minglun;Cohen-or, Daniel;Ascher, Uri;Zhang, Hao - 通讯作者:
Zhang, Hao
Efficient multilevel image segmentation through fuzzy entropy maximization and graph cut optimization
通过模糊熵最大化和图割优化实现高效的多级图像分割
- DOI:
10.1016/j.patcog.2014.03.009 - 发表时间:
2014-09 - 期刊:
- 影响因子:8
- 作者:
Yin, Shibai;Zhao, Xiangmo;Wang, Weixing;Gong, Minglun - 通讯作者:
Gong, Minglun
Integrated Foreground Segmentation and Boundary Matting for Live Videos
- DOI:
10.1109/tip.2015.2401516 - 发表时间:
2015-04-01 - 期刊:
- 影响因子:10.6
- 作者:
Gong, Minglun;Qian, Yiming;Cheng, Li - 通讯作者:
Cheng, Li
Unsupervised hierarchical image segmentation through fuzzy entropy maximization
通过模糊熵最大化的无监督分层图像分割
- DOI:
10.1016/j.patcog.2017.03.012 - 发表时间:
2017-08-01 - 期刊:
- 影响因子:8
- 作者:
Yin, Shibai;Qian, Yiming;Gong, Minglun - 通讯作者:
Gong, Minglun
Gong, Minglun的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Gong, Minglun', 18)}}的其他基金
Quality-driven autonomous 3D reconstruction of large-scale scenes
质量驱动的大规模场景自主 3D 重建
- 批准号:
RGPIN-2017-06086 - 财政年份:2022
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
Quality-driven autonomous 3D reconstruction of large-scale scenes
质量驱动的大规模场景自主 3D 重建
- 批准号:
RGPIN-2017-06086 - 财政年份:2021
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
Quality-driven autonomous 3D reconstruction of large-scale scenes
质量驱动的大规模场景自主 3D 重建
- 批准号:
RGPIN-2017-06086 - 财政年份:2020
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
Quality-driven autonomous 3D reconstruction of large-scale scenes
质量驱动的大规模场景自主 3D 重建
- 批准号:
RGPIN-2017-06086 - 财政年份:2019
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
Quality-driven autonomous 3D reconstruction of large-scale scenes
质量驱动的大规模场景自主 3D 重建
- 批准号:
RGPIN-2017-06086 - 财政年份:2018
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
Robust Algorithms for Real-World Face Recognition
用于现实世界人脸识别的稳健算法
- 批准号:
514500-2017 - 财政年份:2017
- 资助金额:
$ 1.6万 - 项目类别:
Engage Grants Program
Quality-driven autonomous 3D reconstruction of large-scale scenes
质量驱动的大规模场景自主 3D 重建
- 批准号:
RGPIN-2017-06086 - 财政年份:2017
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
A UAV-based system for hybrid LiDAR and photogrammetry sensing
基于无人机的混合激光雷达和摄影测量传感系统
- 批准号:
RTI-2017-00583 - 财政年份:2016
- 资助金额:
$ 1.6万 - 项目类别:
Research Tools and Instruments
Computer vision algorithms for live video processing using programmable graphics hardware
使用可编程图形硬件进行实时视频处理的计算机视觉算法
- 批准号:
293127-2012 - 财政年份:2014
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
Computer vision algorithms for live video processing using programmable graphics hardware
使用可编程图形硬件进行实时视频处理的计算机视觉算法
- 批准号:
293127-2012 - 财政年份:2013
- 资助金额:
$ 1.6万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
基于SOPC的VisionTransformer模型AI推理系统实现研究
- 批准号:2023JJ60221
- 批准年份:2023
- 资助金额:0.0 万元
- 项目类别:省市级项目
老年人群视障风险VISION管控模式构建与实证研究
- 批准号:71974198
- 批准年份:2019
- 资助金额:48.5 万元
- 项目类别:面上项目
相似海外基金
CAREER: Reinventing Computer Vision through Bio-inspired Retinomorphic Vision Sensors, Corticomorphic Compute-In-Memory Processors and Event-based Algorithms
职业:通过仿生视网膜形态视觉传感器、皮质形态内存计算处理器和基于事件的算法重塑计算机视觉
- 批准号:
2338171 - 财政年份:2024
- 资助金额:
$ 1.6万 - 项目类别:
Continuing Grant
SCH: Computer Vision Algorithms to Detect Tics In Patients with Tourette Syndrome
SCH:用于检测抽动秽语综合征患者抽动的计算机视觉算法
- 批准号:
10817272 - 财政年份:2023
- 资助金额:
$ 1.6万 - 项目类别:
AI-empowered 3D Computer Vision and Image-Omics Integration for Digital Kidney Histopathology
AI 赋能的 3D 计算机视觉和图像组学集成用于数字肾脏组织病理学
- 批准号:
10635439 - 财政年份:2023
- 资助金额:
$ 1.6万 - 项目类别:
Developing computer vision algorithms for ferrous scrap and secondary materials grading using images and videos as input, incorporating them into digital passports for increasing UK usage of domestically generated scrap.
使用图像和视频作为输入,开发用于黑色金属废料和二次材料分级的计算机视觉算法,并将其纳入数字护照中,以增加英国对国内产生的废料的使用。
- 批准号:
10076415 - 财政年份:2023
- 资助金额:
$ 1.6万 - 项目类别:
Grant for R&D
Computer Vision for Malaria Microscopy: Automated Detection and Classification of Plasmodium for Basic Science and Pre-Clinical Applications
用于疟疾显微镜的计算机视觉:用于基础科学和临床前应用的疟原虫自动检测和分类
- 批准号:
10576701 - 财政年份:2023
- 资助金额:
$ 1.6万 - 项目类别:
Motor neural dynamics of free behavior enabled through 3D computer vision
通过 3D 计算机视觉实现自由行为的运动神经动力学
- 批准号:
10546485 - 财政年份:2022
- 资助金额:
$ 1.6万 - 项目类别:
Continuous ADL monitoring using computer vision to maintain independence and improve HRQoL in older adults at risk for AD/ADRD
使用计算机视觉进行连续 ADL 监测,以保持独立性并改善有 AD/ADRD 风险的老年人的 HRQoL
- 批准号:
10650307 - 财政年份:2022
- 资助金额:
$ 1.6万 - 项目类别:
An Innovative and Personalised Physiotherapy Exercise Technique Feedback Application Using Computer Vision Algorithms
使用计算机视觉算法的创新和个性化理疗运动技术反馈应用
- 批准号:
10045741 - 财政年份:2022
- 资助金额:
$ 1.6万 - 项目类别:
Grant for R&D
ACESO: Computer Vision Algorithms for Computer-Assisted Surgical Systems
ACESO:计算机辅助手术系统的计算机视觉算法
- 批准号:
567101-2021 - 财政年份:2022
- 资助金额:
$ 1.6万 - 项目类别:
Alliance Grants
Motor neural dynamics of free behavior enabled through 3D computer vision
通过 3D 计算机视觉实现自由行为的运动神经动力学
- 批准号:
10367903 - 财政年份:2022
- 资助金额:
$ 1.6万 - 项目类别: