III: Small: Integrating Casual Discovery and Feature Selection with Streaming Features

III:小:将休闲发现和特征选择与流媒体功能相结合

基本信息

项目摘要

With the advent of emerging massive datasets in image processing,biology, finance, and so on, traditional data mining systemsface new challenges to induce knowledge and discover causalrelations in dynamic streaming feature environments, where newfeatures continuously stream in over time. These challenges include(1) continuous growth of feature volumes over time, (2) a huge featurespace, even of unknown or infinite size, and (3) not all featuresbeing available before learning begins. These challenges call for anew learning paradigm with continuously increasing features. In thisproject, we take the increasing feature volumes as streaming features,and the corresponding learning problem is referred to as OnlineLearning with Streaming Features (OLSF). Since existing onlinelearning efforts mostly deal with data with increasing observationsbut fixed feature dimensions, OLSF provides a unique chance to unfoldand characterize pattern trends for dynamic systems with streamingfeatures.This project aims to address two fundamental issues for OLSF: (1)causal discovery with sequentially increasing feature dimensions; and(2) causal relations for feature selection. We design novel methodsand algorithms for causal discovery in OLSF and establish formal connectionsbetween casual discovery and feature selection by investigating themutual benefits between them in the context of online stream featurelearning. To evaluate the proposed research, we conduct empiricalstudies on a large body of benchmark datasets, as well as with adomain-specific real-world case study in personalized news filteringand summarization where the feature space changes over time. Thenew algorithms and techniques in this project will advance our abilityto discover knowledge from dynamic systems using streaming featureswith bounded resources. The spectrum of the methods from the projectwill not only enrich our knowledge and understanding of patterndiscovery and machine learning for dynamic systems, but also provide anew view to capture and characterize dynamic systems from a streamingfeature perspective.
随着图像处理、生物、金融等领域不断涌现的海量数据集的出现,传统的数据挖掘系统面临着新的挑战,即在动态的流特征环境中,随着时间的推移,新的特征不断涌入,挖掘知识和发现因果关系。这些挑战包括(1)特征量随着时间的推移不断增长,(2)巨大的特征空间,即使是未知的或无限大小的,以及(3)在学习开始之前并不是所有的特征都可用。这些挑战呼唤一种新的学习范式,具有不断增加的特征。在本项目中,我们将不断增加的特征量视为流特征,相应的学习问题称为流特征在线学习(OLSF)。由于现有的在线学习工作大多是处理不断增加的观察量但固定的特征维度的数据,OLSF提供了一个独特的机会来揭示和表征具有流特征的动态系统的模式趋势。本项目旨在解决OLSF的两个基本问题:(1)顺序增加特征维度的因果发现;(2)特征选择的因果关系。我们设计了OLSF中因果发现的新方法和算法,并在在线流特征学习的背景下,通过研究因果发现和特征选择之间的互惠关系,建立了它们之间的形式联系。为了对所提出的研究进行评估,我们在大量基准数据集上进行了经验研究,并在个性化新闻过滤和摘要中进行了广告特定的真实世界的案例研究,其中特征空间随着时间的推移而变化。该项目中的新算法和技术将提高我们使用有限资源的流特征从动态系统中发现知识的能力。该项目的方法谱不仅将丰富我们对动态系统的模式发现和机器学习的知识和理解,而且还将从流特征的角度为捕获和表征动态系统提供新的视角。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Xindong Wu其他文献

A novel variable precision reduction approach to comprehensive knowledge systems
综合知识系统的一种新颖的变量精度降低方法
  • DOI:
    10.1109/tcyb.2017.2648824
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    11.8
  • 作者:
    Chao Yang;Hongbo Liu;Sean McLoone;C. L. Philip Chen;Xindong Wu
  • 通讯作者:
    Xindong Wu
Harvesting data from advanced technologies.
  • DOI:
  • 发表时间:
    2014-11
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xindong Wu
  • 通讯作者:
    Xindong Wu
Certainty-based Preference Completion
基于确定性的偏好完成
  • DOI:
    10.1162/dint_a_00115
  • 发表时间:
    2022-01
  • 期刊:
  • 影响因子:
    3.9
  • 作者:
    Lei Li;Minghe Xue;Zan Zhang;Huanhuan Chen;Xindong Wu
  • 通讯作者:
    Xindong Wu
Intrusion Detection Models Based on Data Mining
基于数据挖掘的入侵检测模型
Mining stable patterns in multiple correlated databases
在多个相关数据库中挖掘稳定模式
  • DOI:
    10.1016/j.dss.2013.06.003
  • 发表时间:
    2013-12
  • 期刊:
  • 影响因子:
    7.5
  • 作者:
    Yaojin Lin;Xuegang Hu;Xiaomei Li;Xindong Wu
  • 通讯作者:
    Xindong Wu

Xindong Wu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Xindong Wu', 18)}}的其他基金

Support for US-Based Students to Attend the 2010 IEEE International Conference on Data Mining (ICDM 2010), December 13-17, 2010, Sydney, Australia
支持美国学生参加 2010 年 IEEE 国际数据挖掘会议 (ICDM 2010),2010 年 12 月 13-17 日,澳大利亚悉尼
  • 批准号:
    1049139
  • 财政年份:
    2010
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
CIF:Medium:Collaborative Research: Integrating and Mining Bio-Data from Multiple Sources in Biological Networks
CIF:Medium:协作研究:整合和挖掘生物网络中多个来源的生物数据
  • 批准号:
    0905337
  • 财政年份:
    2009
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Pattern Matching with Wildcards and Length Constraints
具有通配符和长度约束的模式匹配
  • 批准号:
    0514819
  • 财政年份:
    2005
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: AF: Small: Graph Analysis: Integrating Metric and Topological Perspectives
合作研究:AF:小:图分析:整合度量和拓扑视角
  • 批准号:
    2310412
  • 财政年份:
    2023
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
CC* Integration-Small: Integrating Application Agnostic Learning with FABRIC for Enabling Realistic High-Fidelity Traffic Generation and Modeling
CC* Integration-Small:将应用程序无关学习与 FABRIC 集成,以实现现实的高保真流量生成和建模
  • 批准号:
    2419070
  • 财政年份:
    2023
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Efficient Ways to Enlarge Practical DNA Storage Capacity by Integrating Bio-Computer Technologies
合作研究:中枢神经系统核心:小型:通过集成生物计算机技术扩大实用 DNA 存储容量的有效方法
  • 批准号:
    2343863
  • 财政年份:
    2023
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
RI: Small: Integrating physics, data, and art-based insights for controllable generative models
RI:小型:集成物理、数据和基于艺术的见解以实现可控生成模型
  • 批准号:
    2323086
  • 财政年份:
    2023
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: Graph Analysis: Integrating Metric and Topological Perspectives
合作研究:AF:小:图分析:整合度量和拓扑视角
  • 批准号:
    2310411
  • 财政年份:
    2023
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
III : Small : Integrating and Learning on Spatial Data via Multi-Agent Simulation
III:小:通过多智能体模拟集成和学习空间数据
  • 批准号:
    2311954
  • 财政年份:
    2023
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Efficient Ways to Enlarge Practical DNA Storage Capacity by Integrating Bio-Computer Technologies
合作研究:中枢神经系统核心:小型:通过集成生物计算机技术扩大实用 DNA 存储容量的有效方法
  • 批准号:
    2204656
  • 财政年份:
    2022
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Efficient Ways to Enlarge Practical DNA Storage Capacity by Integrating Bio-Computer Technologies
合作研究:中枢神经系统核心:小型:通过集成生物计算机技术扩大实用 DNA 存储容量的有效方法
  • 批准号:
    2204657
  • 财政年份:
    2022
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
Integrating HDX-MS and Molecular Dynamics to investigate the mechanism of activation of the RORy by multiple small molecule modulators
整合 HDX-MS 和分子动力学研究多种小分子调节剂激活 RORy 的机制
  • 批准号:
    2736597
  • 财政年份:
    2022
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Studentship
CNS Core: Small: Integrating Real-Time Learning and Control for Large and Dynamic Networked Computer Systems
CNS 核心:小型:集成大型动态网络计算机系统的实时学习和控制
  • 批准号:
    2113893
  • 财政年份:
    2021
  • 资助金额:
    $ 49.79万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了