Using data augmentation, active learning, and visual analytics for learning with limited examples on mobility data sets

使用数据增强、主动学习和可视化分析,通过移动数据集的有限示例进行学习

基本信息

  • 批准号:
    RGPIN-2022-03909
  • 负责人:
  • 金额:
    $ 1.82万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

The increasing access to positioning devices technologies such as smartphones and GPS-enabled cameras has resulted in vast volumes of mobility data collected, stored, and available for analysis. However, it is difficult to find data sets containing annotated trajectories since labels tend to indicate a specific behavior whose identification depends on human interpretation. Labels are essential in supervised learning problems to predict an outcome, such as the transportation mean used by a user carrying a smartphone or if a vessel is performing a fishing activity. Understanding the moving object behavior depends on multiple factors and, often, cannot be automatically inferred. Therefore, the annotation process may be complex and time-consuming even for domain experts since trajectory data has a vast volume and, in many cases, several attributes (high dimensionality). Consequently, reducing the labeling effort is of interest to researchers and industries working in marine transportation, tourism, wildlife monitoring, and traffic management. A promising approach to address the lack of labels is to use data augmentation techniques that create new data samples from known patterns in order to expand the decision boundary of a classification model. Another approach is to use active learning strategies that help to select a subset of examples from an unlabeled pool of data so that obtaining annotations will result in a maximal increase of model performance. Current strategies cannot be used directly with trajectory data due to their spatiotemporal dependencies. Trajectory data tend to be large and high dimensional, making it difficult to annotate it from the user's perspective. Assembling interactive tools for annotating trajectories to effectively assist the user in coping with all the aforementioned aspects during the labeling process can be done using visual analytics. Visual analytics uses interactive graphical interfaces to help make decisions more efficiently and effectively by merging interactivity with automated visual analysis. Therefore, this research program aims to develop new data augmentation, active learning, and visual analytics strategies and tools to allow the mobility data mining field to learn robust models with a limited set of examples. Learning with a limited set of examples is one of the most challenging setups in machine learning. This program will train several undergraduate and graduate students who will benefit from realistic and industry-relevant thesis' topics in the mobility data analysis domain. Government departments and Canadian industries working with these topics will benefit from the outcomes of this program (Highly Qualified Personnel (HQP), production of software systems, and libraries). Moreover, this program will provide new solutions to current applied science and technology challenges involving mobility data, decrease costs involved in creating labeled mobility datasets, and provide more accurate services.
越来越多的人使用定位设备技术,如智能手机和支持GPS的相机,导致大量的移动数据被收集、存储和用于分析。然而,很难找到包含注释轨迹的数据集,因为标签往往表示其识别依赖于人类解释的特定行为。标签在监督学习问题中至关重要,可以预测结果,例如携带智能手机的用户使用的交通工具,或者船只是否正在进行捕鱼活动。了解移动对象的行为取决于多种因素,并且通常无法自动推断。因此,即使对于领域专家,注释过程也可能是复杂且耗时的,因为轨迹数据具有巨大的体积,并且在许多情况下,具有若干属性(高维度)。因此,减少标签工作是研究人员和海洋运输,旅游,野生动物监测和交通管理工作的行业感兴趣。 一个有前途的方法来解决缺乏标签是使用数据增强技术,创建新的数据样本从已知的模式,以扩大决策边界的分类模型。另一种方法是使用主动学习策略,帮助从未标记的数据池中选择一个子集的例子,以便获得注释将导致模型性能的最大提高。目前的策略不能直接使用的轨迹数据,由于其时空依赖性。轨迹数据往往是大的和高维的,使得难以从用户的角度对其进行注释。组装用于注释轨迹的交互式工具以有效地帮助用户在标记过程期间应对所有上述方面可以使用视觉分析来完成。可视化分析使用交互式图形界面,通过将交互性与自动化可视化分析相结合,帮助更高效地做出决策。因此,该研究计划旨在开发新的数据增强,主动学习和可视化分析策略和工具,以使移动数据挖掘领域能够通过有限的示例来学习强大的模型。使用有限的示例集进行学习是机器学习中最具挑战性的设置之一。该计划将培养几名本科生和研究生,他们将从移动数据分析领域的现实和行业相关论文主题中受益。与这些主题合作的政府部门和加拿大行业将受益于该计划的成果(高素质人才(HQP),软件系统的生产和库)。此外,该计划将为当前涉及移动数据的应用科学和技术挑战提供新的解决方案,降低创建标记移动数据集的成本,并提供更准确的服务。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Soares, Amilcar其他文献

A new approach to soil classification mapping based on the spatial distribution of soil properties
  • DOI:
    10.1016/j.geoderma.2013.12.011
  • 发表时间:
    2014-05-01
  • 期刊:
  • 影响因子:
    6.1
  • 作者:
    da Silva, Alessandra Fagioli;Pereira, Maria Joao;Soares, Amilcar
  • 通讯作者:
    Soares, Amilcar
A temporal assessment of risk of non-indigenous species introduction by ballast water to Canadian coastal waters based on environmental similarity.
  • DOI:
    10.1007/s10530-023-03019-1
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    2.9
  • 作者:
    Song, Ruixin;Tavakoli, Yashar;Bailey, Sarah A.;Soares, Amilcar
  • 通讯作者:
    Soares, Amilcar
Excess Heat Factor climatology, trends, and exposure across European Functional Urban Areas
  • DOI:
    10.1016/j.wace.2022.100455
  • 发表时间:
    2022-05-05
  • 期刊:
  • 影响因子:
    8
  • 作者:
    Oliveira, Ana;Lopes, Antonio;Soares, Amilcar
  • 通讯作者:
    Soares, Amilcar
Geostatistical COVID-19 infection risk maps for Portugal
  • DOI:
    10.1186/s12942-020-00221-5
  • 发表时间:
    2020-07-06
  • 期刊:
  • 影响因子:
    4.9
  • 作者:
    Azevedo, Leonardo;Pereira, Maria Joao;Soares, Amilcar
  • 通讯作者:
    Soares, Amilcar
An urban energy balance-guided machine learning approach for synthetic nocturnal surface Urban Heat Island prediction: A heatwave event in Naples
  • DOI:
    10.1016/j.scitotenv.2021.150130
  • 发表时间:
    2021-09-16
  • 期刊:
  • 影响因子:
    9.8
  • 作者:
    Oliveira, Ana;Lopes, Antonio;Soares, Amilcar
  • 通讯作者:
    Soares, Amilcar

Soares, Amilcar的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Soares, Amilcar', 18)}}的其他基金

Using data augmentation, active learning, and visual analytics for learning with limited examples on mobility data sets
使用数据增强、主动学习和可视化分析,通过移动数据集的有限示例进行学习
  • 批准号:
    DGECR-2022-00386
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Launch Supplement

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于高频信息下高维波动率矩阵估计及应用
  • 批准号:
    71901118
  • 批准年份:
    2019
  • 资助金额:
    18.0 万元
  • 项目类别:
    青年科学基金项目
半参数空间自回归面板模型的有效估计与应用研究
  • 批准号:
    71961011
  • 批准年份:
    2019
  • 资助金额:
    16.0 万元
  • 项目类别:
    地区科学基金项目
高频数据波动率统计推断、预测与应用
  • 批准号:
    71971118
  • 批准年份:
    2019
  • 资助金额:
    50.0 万元
  • 项目类别:
    面上项目
基于个体分析的投影式非线性非负张量分解在高维非结构化数据模式分析中的研究
  • 批准号:
    61502059
  • 批准年份:
    2015
  • 资助金额:
    19.0 万元
  • 项目类别:
    青年科学基金项目
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
体数据表达与绘制的新方法研究
  • 批准号:
    61170206
  • 批准年份:
    2011
  • 资助金额:
    55.0 万元
  • 项目类别:
    面上项目
一类新Regime-Switching模型及其在金融建模中的应用研究
  • 批准号:
    11061041
  • 批准年份:
    2010
  • 资助金额:
    24.0 万元
  • 项目类别:
    地区科学基金项目

相似海外基金

All for data, data for all: Improving accessibility of healthcare data through a co-designed augmentation of an existing online rehabilitation application.
一切为了数据,数据为所有人:通过共同设计的现有在线康复应用程序的增强功能,提高医疗保健数据的可访问性。
  • 批准号:
    10054277
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Grant for R&D
Prime editing for Crumbs homologue 1 (CRB1) Inherited Retinal Dystrophies
Crumbs 同源物 1 (CRB1) 遗传性视网膜营养不良的 Prime 编辑
  • 批准号:
    10636325
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
Genome Editing Therapy for Usher Syndrome Type 3
针对 3 型亚瑟综合症的基因组编辑疗法
  • 批准号:
    10759804
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
Identifying mechanistic pathways underlying RPE pathogenesis in models of pattern dystrophy
识别模式营养不良模型中 RPE 发病机制的机制途径
  • 批准号:
    10636678
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
Precision genome editing in vivo to treat retinal diseases
体内精准基因组编辑治疗视网膜疾病
  • 批准号:
    10565189
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
Novel Implementation of Microporous Annealed Particle HydroGel for Next-generation Posterior Pharyngeal Wall Augmentation
用于下一代咽后壁增强的微孔退火颗粒水凝胶的新实现
  • 批准号:
    10727361
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
Biomechanical Treatment of CTS Via Carpal Arch Space Augmentation: A Pilot Clinical Trial
通过腕弓间隙增大治疗 CTS 的生物力学治疗:初步临床试验
  • 批准号:
    10725257
  • 财政年份:
    2023
  • 资助金额:
    $ 1.82万
  • 项目类别:
Expressive data augmentation in deep learning
深度学习中的富有表现力的数据增强
  • 批准号:
    RGPIN-2022-04651
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Grants Program - Individual
Using data augmentation, active learning, and visual analytics for learning with limited examples on mobility data sets
使用数据增强、主动学习和可视化分析,通过移动数据集的有限示例进行学习
  • 批准号:
    DGECR-2022-00386
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
    Discovery Launch Supplement
Bayesian Data Augmentation for Recurrent Events in Electronic Medical Records of Patients with Cancer
癌症患者电子病历中重复事件的贝叶斯数据增强
  • 批准号:
    10436083
  • 财政年份:
    2022
  • 资助金额:
    $ 1.82万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了