Objektsegmentierung in Videodaten mittels Analyse von Punkttrajektorien

使用点轨迹分析进行视频数据中的对象分割

基本信息

项目摘要

Das Lernen von Objektrepräsentationen wird zur Zeit von überwachten Lernverfahren dominiert. Diese Verfahren benötigen manuell annotierte, idealerweise segmentierte Trainingsbilder und profitieren dabei von großen Datensätzen. Da deren Aquirierung jedoch aufwendig ist, wird meist versucht, das Erkennungsproblem mit möglichst wenig Trainingsdaten zu lösen. Diese Aufgabe erscheint unnatürlich, bedenkt man, dass ein Kleinkind im Alter von zwei Jahren bereits knapp zwei Milliarden Bilder gesehen hat. In diesem Projekt soll daher die natürliche Anordnung von Bildern in Videos ausgenutzt werden um Objekte vollautomatisch zu segmentieren und damit den aufwendigsten Teil der Annotierung durch einen unüberwachten Ansatz zu ersetzen. Insbesondere sollen Objekte anhand ihrer Eigenbewegung segmentiert werden. Dazu werden im Gegensatz zu früheren Arbeiten längere Zeiträume von mehreren Sekunden analysiert, um der zeitlich variierenden Qualität des Bewegungssignals Rechnung zu tragen. Mit der Erweiterung auf Videos einer Stereokamera soll schließlich ein weiteres, natürlich zur Verfügung stehendes Merkmal, nämlich die Disparität, zur räumlich-zeitlichen Segmentierung mit genutzt werden.
对象的学习将在学习过程中占据主导地位。这些培训手册是手工注释的,理想的培训材料和利润来源于大数据。随着水资源的增加,我们会发现,在训练数据中存在的问题越来越多。这一次的胜利是不自然的,因为在25年前,一个小孩子获得了克纳普20亿美元的资金。在这个项目中,视频中的图片自然的注释也被韦尔登用于分割对象,并通过一个单独的注释来增加注释的深度。只有一个物体和它的特征部分是韦尔登。Dazu韦尔登(Dazu韦尔登im Gegensatz zu früheren Arbeiten längere Zeiträume von mehreren Sekunden analysiert,um der zeitlich varierenden Qualität des Bewegungssignals Rechnung zu tragen)。Mit der Erweiterung auf Videos einer Stereokamera soll schließlich ein weiteres,natürlich zur Verfügung stehendes Merkmal,nämlich die Disparität,zur räumlich-zeitlichen Segmentierung mit genutzt韦尔登.

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
DeMoN: Depth and Motion Network for Learning Monocular Stereo
Motion Trajectory Segmentation via Minimum Cost Multicuts
iPiano: Inertial Proximal Algorithm for Nonconvex Optimization
  • DOI:
    10.1137/130942954
  • 发表时间:
    2014-01-01
  • 期刊:
  • 影响因子:
    2.1
  • 作者:
    Ochs, Peter;Chen, Yunjin;Pock, Thomas
  • 通讯作者:
    Pock, Thomas
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Professor Dr.-Ing. Thomas Brox其他文献

Professor Dr.-Ing. Thomas Brox的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Professor Dr.-Ing. Thomas Brox', 18)}}的其他基金

Training Deep Networks for Real-world Computer Vision Scenarios with Rendered Data
使用渲染数据训练真实计算机视觉场景的深度网络
  • 批准号:
    401269959
  • 财政年份:
    2018
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Spatio-Temporal Hypercolumns for Instance-based Semantic Segmentation in Video
用于视频中基于实例的语义分割的时空超列
  • 批准号:
    387723725
  • 财政年份:
    2017
  • 资助金额:
    --
  • 项目类别:
    Research Grants
Auto-Tune: Structural Optimization of Machine Learning Frameworks for Large Datasets
Auto-Tune:大型数据集机器学习框架的结构优化
  • 批准号:
    260351709
  • 财政年份:
    2014
  • 资助金额:
    --
  • 项目类别:
    Priority Programmes
Superresolution Videos and Optical Flow based on Combinatorial and Variational Optimization
基于组合和变分优化的超分辨率视频和光流
  • 批准号:
    243568440
  • 财政年份:
    2014
  • 资助金额:
    --
  • 项目类别:
    Research Grants
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了