BIGDATA: Small: DA: DCM: Labeling the World

大数据: 小: DA: DCM: 标记世界

基本信息

  • 批准号:
    1250793
  • 负责人:
  • 金额:
    $ 75万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-04-01 至 2017-03-31
  • 项目状态:
    已结题

项目摘要

The project aims to leverage the massive corpus of online photos, text, and maps to create a semantic 3D labeled model of the world, e.g., detailed representations of the world's top cultural and historical sites. While breakthroughs in computer vision enable creating detailed 3D models from millions of online 2D images, the resulting models capture only geometry. Consequently, they lack semantics; they don't provide information about the contents of the scene. The vast treasure trove of online text such as Wikipedia meticulously catalogs the scenes that are captured in photos and models. Modern Natural Language Processing (NLP) techniques can now process such data, opening up the opportunity to extract knowledge from the online text corpus and use it to label 3D geometry. This project seeks to jointly analyze the massive corpus of online text, maps, and photos to create labeled 3D models of the world's sites. Achieving this goal will require fundamental research advances at the interface of natural language processing and computer vision that impact both the scientific research community and the world at large. The project addresses two key technical challenges: (1) automatic scene labeling: mapping semantics onto geometry, and (2) solving the 3D jigsaw puzzle: mapping pieces of geometry into the world. Many clues to these mapping problems lie in the text and other online datasources such as floorplans. Other clues lie in the content of the photos. Decoding this mapping therefore involves an interplay between NLP and computer vision. The key research advances center around new ways to jointly leverage computer vision and NLP to solve problems to solve challenging problems in both fields, specifically, 1) recognizing objects through joint NLP and 3D visual analysis, 2) placing objects in the world by correlating geometry with spatial text in maps and webpages, and 3) using semantics to improve geometry by augmenting visual cues with textual spatial relations.Broader Impacts: The primary research outcomes are: (1) technology for creating labeled 3D models at a massive scale, and (2) labeled models for many top tourist sites. Both the algorithms and models will be made freely available for the research community. These algorithms and models will provide the foundation for a range of exciting applications of major practical impact on the world at large. The resulting tools could make it possible for resources such as Wikipedia to link the text directly to 3D models and vice-versa, with attendant benefits to online learning and education. The same technology could enable automated labeling of 2D photographs. In the context of real-time applications (e.g., augmented reality), the technology could provide visual overlays and instant feedback on what you are currently looking at, and enable augmented reality-style guided tours. Other applications include using labeled geometry for navigation (walking directions), and converting images to text for the visually impaired. The research is tightly integrated into education and training of students at the University of Washington. Additional information about the project can be found at: http://grail.cs.washington.edu/projects/label3d/
该项目旨在利用在线照片、文本和地图的海量语料库来创建世界的语义3D标签模型,例如,世界顶级文化和历史遗址的详细表示。虽然计算机视觉的突破使人们能够从数以百万计的在线2D图像中创建详细的3D模型,但生成的模型只捕捉几何图形。因此,它们缺乏语义;它们不提供有关场景内容的信息。维基百科等庞大的在线文本宝库精心编目了照片和模型中捕捉到的场景。现代自然语言处理(NLP)技术现在可以处理这些数据,从而打开了从在线文本语料库中提取知识并使用它来标记3D几何图形的机会。这个项目寻求联合分析在线文本、地图和照片的海量语料库,以创建世界各地网站的标记3D模型。实现这一目标将需要在自然语言处理和计算机视觉的接口上取得基础研究进展,这将对科学研究界和整个世界产生影响。该项目解决了两个关键的技术挑战:(1)自动场景标记:将语义映射到几何体上,以及(2)解决3D拼图:将几何体的碎片映射到世界上。这些地图问题的许多线索存在于文本和其他在线数据来源中,如平面图。其他线索存在于照片的内容中。因此,对这种映射进行解码涉及到NLP和计算机视觉之间的相互作用。主要的研究进展围绕着联合利用计算机视觉和自然语言处理来解决问题的新方法来解决这两个领域的挑战性问题,具体地说,1)通过联合NLP和3D视觉分析来识别对象,2)通过将几何与地图和网页中的空间文本相关联来放置对象,3)通过使用语义来增强视觉线索以增强文本空间关系来改善几何。广泛的影响:主要的研究成果是:(1)大规模创建标记的3D模型的技术,以及(2)许多顶级旅游景点的标记模型。算法和模型都将免费提供给研究社区。这些算法和模型将为对整个世界产生重大实际影响的一系列令人兴奋的应用程序提供基础。由此产生的工具可能使维基百科等资源有可能将文本直接链接到3D模型,反之亦然,从而带来在线学习和教育的好处。同样的技术可以实现2D照片的自动标记。在实时应用程序(例如,增强现实)的背景下,该技术可以提供关于您当前正在观看的内容的可视覆盖和即时反馈,并支持增强现实风格的导游。其他应用包括使用带标签的几何图形进行导航(步行方向),以及为视障人士将图像转换为文本。这项研究与华盛顿大学学生的教育和培训紧密结合在一起。有关该项目的更多信息,请访问:http://grail.cs.washington.edu/projects/label3d/

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Steven Seitz其他文献

Steven Seitz的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Steven Seitz', 18)}}的其他基金

RI: Medium: Collaborative Research: Reconstructing Cities from Photographs
RI:媒介:合作研究:从照片重建城市
  • 批准号:
    0963657
  • 财政年份:
    2010
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
RI-Small: Multi-level Priors for Multi-view Stereo
RI-Small:多视图立体的多级先验
  • 批准号:
    0811878
  • 财政年份:
    2008
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Discovering and Reconstructing Scenes from Photos on the Internet
从互联网上的照片中发现并重建场景
  • 批准号:
    0743635
  • 财政年份:
    2007
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
Data-Driven Modeling of Shape, Reflection, and Interreflection
形状、反射和互反射的数据驱动建模
  • 批准号:
    0413198
  • 财政年份:
    2004
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
ITR/AP(CISE): Capturing and Modeling Physics from Images
ITR/AP(CISE):从图像中捕捉物理现象并对其进行建模
  • 批准号:
    0113007
  • 财政年份:
    2001
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
CAREER: Plenoptic Scene Reconstruction
职业:全光场景重建
  • 批准号:
    9984672
  • 财政年份:
    2000
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
CAREER: Plenoptic Scene Reconstruction
职业:全光场景重建
  • 批准号:
    0049095
  • 财政年份:
    2000
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
Decision and Research Support Systems in Artificial Intelligence
人工智能中的决策和研究支持系统
  • 批准号:
    8612072
  • 财政年份:
    1986
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

BIGDATA: Small: DA: Collaborative Research: Real Time Observation Analysis for Healthcare Applications via Automatic Adaptation to Hardware Limitations
BIGDATA:小型:DA:协作研究:通过自动适应硬件限制对医疗保健应用进行实时观察分析
  • 批准号:
    1638429
  • 财政年份:
    2016
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Mining large graphs through subgraph sampling
BIGDATA:小:DA:通过子图采样挖掘大图
  • 批准号:
    1250786
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Collaborative Research: Real Time Observation Analysis for Healthcare Applications via Automatic Adaptation to Hardware Limitations
BIGDATA:小型:DA:协作研究:通过自动适应硬件限制对医疗保健应用进行实时观察分析
  • 批准号:
    1251031
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Classification Platform for Novel Scientific Insight on Time-Series Data
BIGDATA:小型:DA:时间序列数据新科学见解的分类平台
  • 批准号:
    1251274
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: DCM: Measurement and Learning in Large-Scale Social Networks
BIGDATA:小型:DA:DCM:大规模社交网络中的测量和学习
  • 批准号:
    1251267
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
BIGDATA: Small DA Social Behavior Driven Modeling and Optimization of Information
BIGDATA:小型 DA 社会行为驱动的信息建模和优化
  • 批准号:
    8842138
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
BIGDATA: Small: DA: A Random Projection Approach
大数据:小:DA:随机投影方法
  • 批准号:
    1419210
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Dynamical diffusion map methods for high dimensional data
BIGDATA:小:DA:高维数据的动态扩散图方法
  • 批准号:
    1250936
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Continuing Grant
BIGDATA: Small: DCM: DA: Building a Mergeable and Interactive Distributed Data Layer for Big Data Summarization Systems
BIGDATA:小型:DCM:DA:为大数据汇总系统构建可合并和交互式的分布式数据层
  • 批准号:
    1251019
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
  • 批准号:
    1251131
  • 财政年份:
    2013
  • 资助金额:
    $ 75万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了