XPS: FULL: DSD: Collaborative Research: FPGA Cloud Platform for Deep Learning, Applications in Computer Vision

XPS:完整:DSD:协作研究:深度学习 FPGA 云平台、计算机视觉应用

基本信息

项目摘要

We stand on the verge of dramatic advances in deep learning applications, which will soon enable practicality and widespread adoption of computer vision based recognition in scientific inquiry, commercial applications, and everyday life. Grand challenge problems are within our reach; we will soon be able to build automated systems that recognize nearly everything we see, systems that can recognize the tens of thousands of basic-level categories that psychologists posit humans can recognize, systems that continuously learn from photos, video, and web content in order to create more complete and accurate visual models of the world. However, while it is clear that the computational capabilities for deep learning are within reach, it is equally clear that the required computational power cannot come from general-purpose processors. To succeed, we will need to build specialized domain-specific computing systems based on hardware accelerators that are capable of exploiting the extreme fine-grained parallelism inherent in deep-learning workloads. This project leverages parallelization and reconfigurable hardware to create an automated system that distributes computer vision algorithms onto a large number of field-programmable gate arrays (FPGA Cloud). This project builds on recent advances in domain-specific hardware generation tools in order to bring the potential parallelism and performance per watt advantages of FPGAs to large-scale computer vision problems. By developing a platform to run deep learning algorithms on large clouds of FPGAs, this proposal explicitly addresses scaling algorithms beyond what a single chip can process. This involves addressing a wide range of challenging problems in algorithm analysis, building domain-specific hardware generators, communication for scaling algorithms across multiple FPGAs, and extensive validation of generating hardware for state-of-the-art deep learning approaches applied to computer vision problems. This project advances tools for designing domain-specific FPGA implementations of algorithms, taking a step toward making more efficient computing with greater parallelism more widely available. In particular, for computer vision, there will be significant benefits from a product of multiple improvements: higher parallelism, lower gate requirement by moving to fixed point when possible, and better performance per watt leading to higher computation density in servers. Together, these have the potential to significantly increase the extent to which computer vision can be a part of our daily lives, making computers better able to understand the context of our world.
我们站在深度学习应用的巨大进步的边缘,这将很快使基于计算机视觉的识别在科学研究、商业应用和日常生活中得到实用和广泛的采用。 我们很快就能构建出几乎能识别我们所看到的一切的自动化系统,能够识别心理学家所能识别的成千上万个基本类别的系统,能够从照片、视频和网络内容中不断学习的系统,以创建更完整、更准确的世界视觉模型。 然而,虽然深度学习的计算能力是可以实现的,但同样清楚的是,所需的计算能力无法来自通用处理器。 为了取得成功,我们需要基于硬件加速器构建专门的特定领域计算系统,这些硬件加速器能够利用深度学习工作负载中固有的极细粒度并行性。 该项目利用并行化和可重构硬件来创建一个自动化系统,将计算机视觉算法分发到大量现场可编程门阵列(FPGA Cloud)上。该项目建立在特定领域硬件生成工具的最新进展基础上,以便将FPGA的潜在并行性和每瓦性能优势带到大规模计算机视觉问题中。 通过开发一个在大型FPGA云上运行深度学习算法的平台,该提案明确地解决了扩展算法超出单个芯片可以处理的问题。 这涉及解决算法分析中的各种挑战性问题,构建特定领域的硬件生成器,跨多个FPGA扩展算法的通信,以及为应用于计算机视觉问题的最先进深度学习方法生成硬件的广泛验证。 该项目推进了用于设计算法的特定领域FPGA实现的工具,朝着更广泛地提供具有更大并行性的更高效计算迈出了一步。 特别是对于计算机视觉,多项改进的产品将带来显著的好处:更高的并行性,尽可能移动到固定点以降低门要求,以及更好的每瓦性能,从而提高服务器的计算密度。 总之,这些都有可能显着提高计算机视觉成为我们日常生活一部分的程度,使计算机能够更好地理解我们世界的背景。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Alexander Berg其他文献

Cuticular hydrocarbons on old museum specimens of the spiny mason wasp, Odynerus spinipes (Hymenoptera: Vespidae: Eumeninae), shed light on the distribution and on regional frequencies of distinct chemotypes
旧博物馆多刺石蜂 Odynerus spinipes(膜翅目:胡蜂科:胡蜂亚科)标本上的表皮碳氢化合物揭示了不同化学型的分布和区域频率
  • DOI:
  • 发表时间:
    2020
  • 期刊:
  • 影响因子:
    1.8
  • 作者:
    V. Moris;Katharina Christmann;Aline Wirtgen;S. Belokobylskij;Alexander Berg;W. Liebig;Villu Soon;H. Baur;T. Schmitt;O. Niehuis
  • 通讯作者:
    O. Niehuis
Time delay and evidence profiles forming clinical recommendations of US surgical society guidelines
美国外科学会指南形成临床推荐意见过程中的时间延迟与证据概况
  • DOI:
    10.1016/j.surg.2024.10.007
  • 发表时间:
    2025-02-01
  • 期刊:
  • 影响因子:
    2.700
  • 作者:
    Alexander Berg;Nam Yong Cho;Kaustav Chattopadhyay;Sachin Narayan;Jude Alawa;David A. Spain;Jeff Choi
  • 通讯作者:
    Jeff Choi
Miasma und Kontagium Die Lehre von der Ansteckung im Wandel der Zeiten
  • DOI:
    10.1007/bf01178592
  • 发表时间:
    1963-06-01
  • 期刊:
  • 影响因子:
    2.100
  • 作者:
    Alexander Berg
  • 通讯作者:
    Alexander Berg
Die Lehre von der Faser als Form- und Funktionselement des Organismus
  • DOI:
    10.1007/bf02593519
  • 发表时间:
    1942-11-01
  • 期刊:
  • 影响因子:
    3.100
  • 作者:
    Alexander Berg
  • 通讯作者:
    Alexander Berg
Erratum to: Strategies to obtain pattern fidelity in nanowire growth from large-area surfaces patterned using nanoimprint lithography
勘误:关于从使用纳米压印光刻技术图案化的大面积表面进行纳米线生长以获得图案保真度的策略
  • DOI:
    10.1007/s12274-016-1379-0
  • 发表时间:
    2017-01-27
  • 期刊:
  • 影响因子:
    9.000
  • 作者:
    Gaute Otnes;Magnus Heurlin;Mariusz Graczyk;Jesper Wallentin;Daniel Jacobsson;Alexander Berg;Ivan Maximov;Magnus T. Borgström
  • 通讯作者:
    Magnus T. Borgström

Alexander Berg的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Alexander Berg', 18)}}的其他基金

NRI: Collaborative Research: Task Dependent Semantic Modeling for Robot Perception
NRI:协作研究:机器人感知的任务相关语义建模
  • 批准号:
    1526367
  • 财政年份:
    2015
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
CAREER: Situated Recognition: Learning to understand our local visual environment
职业:情境识别:学习了解我们当地的视觉环境
  • 批准号:
    1452851
  • 财政年份:
    2015
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant

相似国自然基金

钴基Full-Heusler合金的掺杂效应和薄膜噪声特性研究
  • 批准号:
    51871067
  • 批准年份:
    2018
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目

相似海外基金

XPS: FULL: DSD: Collaborative Research: Parallelizing and Accelerating Metagenomic Applications
XPS:完整:DSD:协作研究:并行化和加速宏基因组应用
  • 批准号:
    1720635
  • 财政年份:
    2016
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: A Parallel Tensor Infrastructure (ParTI!) for Data Analysis
XPS:完整:DSD:用于数据分析的并行张量基础设施 (PartTI!)
  • 批准号:
    1533768
  • 财政年份:
    2015
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Parallel Motion Planning for Cloud-connected Robots
XPS:完整:DSD:云连接机器人的并行运动规划
  • 批准号:
    1533844
  • 财政年份:
    2015
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Parallelizing and Accelerating Metagenomic Applications
XPS:完整:DSD:协作研究:并行化和加速宏基因组应用
  • 批准号:
    1533933
  • 财政年份:
    2015
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Scalable High Performance with Halide and Simit Domain Specific Languages
XPS:完整:DSD:使用 Halide 和 Simit 领域特定语言的可扩展高性能
  • 批准号:
    1533753
  • 财政年份:
    2015
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Parallelizing and Accelerating Metagenomic Applications
XPS:完整:DSD:协作研究:并行化和加速宏基因组应用
  • 批准号:
    1533797
  • 财政年份:
    2015
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Moving the Abyss: Database Management on Future 1000-core Processors
XPS:完整:DSD:协作研究:移动深渊:未来 1000 核处理器上的数据库管理
  • 批准号:
    1438955
  • 财政年份:
    2014
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Rapid Prototyping HPC Environment for Deep Learning
XPS:完整:DSD:协作研究:深度学习的快速原型 HPC 环境
  • 批准号:
    1439052
  • 财政年份:
    2014
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Rapid Prototyping HPC Environment for Deep Learning
XPS:完整:DSD:协作研究:深度学习的快速原型 HPC 环境
  • 批准号:
    1439007
  • 财政年份:
    2014
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
XPS: FULL: DSD: Collaborative Research: Moving the Abyss: Database Management on Future 1000-core Processors
XPS:完整:DSD:协作研究:移动深渊:未来 1000 核处理器上的数据库管理
  • 批准号:
    1438967
  • 财政年份:
    2014
  • 资助金额:
    $ 30.1万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了