III: Small: Unsupervised Feature Selection in the Era of Big Data

III:小:大数据时代的无监督特征选择

基本信息

  • 批准号:
    1714741
  • 负责人:
  • 金额:
    $ 48.04万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-08-15 至 2021-07-31
  • 项目状态:
    已结题

项目摘要

Feature selection has been proven to be efficient and effective in preparing high-dimensional data for data mining and machine learning applications, especially when the original features are important for model interpretation and knowledge extraction. The growth of data in both size and complexity accelerates rapidly as the dramatic increase of the capacity to collect data. Such big data has imposed tremendous challenges on traditional feature selection methods, which are usually designed to handle homogeneous and static data in a centralized fashion. Meanwhile in many real-world domains big data is unlabeled, which further exacerbates the difficulty. Therefore, the majority of existing feature selection methods are not well prepared for big data, and this thus calls for the development of novel unsupervised feature selection for unlabeled big data. The project extends the state-of-the-art feature selection research to a new frontier of taming big data. It has potential to benefit a number of real-world applications from various disciplines such as Computer Science, Business, Education, Politics, Healthcare and Bioinformatics. This project proposes a suite of novel approaches for unsupervised feature selection to facilitate the computational understanding of big data, investigating associated fundamental research issues and developing effective algorithms. It consists of three major thrusts. First, it studies various strategies to scale unsupervised feature selection to handle large-scale and distributed data; and investigates distributed unsupervised feature selection with structured features and under asynchronous updates. Second, it develops a family of heterogeneous unsupervised feature selection with multiple types of heterogeneity. Third, it defines the unsupervised feature selection with various streaming scenarios, and develops new algorithms to improve the capability of unsupervised feature selection in handling the corresponding streaming settings. Disparate means are planned to disseminate the project and its findings, including web enabled data and software repositories, books, journal and conference publications, special-purpose workshops or tutorials, and external collaborations. The project lies at the confluence of feature selection, big data analysis, machine learning and data mining. It can be effectively integrated to undergraduate and graduate courses as well as in student research projects.
特征选择已被证明是高效和有效的准备高维数据的数据挖掘和机器学习应用程序,特别是当原始特征是重要的模型解释和知识提取。随着数据收集能力的急剧增加,数据的规模和复杂性都在迅速增长。这些大数据对传统的特征选择方法提出了巨大的挑战,这些方法通常被设计为以集中的方式处理同质和静态数据。与此同时,在许多现实世界的领域,大数据是未标记的,这进一步加剧了困难。因此,大多数现有的特征选择方法都没有为大数据做好充分的准备,这就需要为未标记的大数据开发新的无监督特征选择。该项目将最先进的特征选择研究扩展到驯服大数据的新前沿。它有可能使计算机科学,商业,教育,政治,医疗保健和生物信息学等各个学科的许多现实世界的应用程序受益。该项目提出了一套用于无监督特征选择的新方法,以促进对大数据的计算理解,调查相关的基础研究问题并开发有效的算法。它包括三个主要的推力。 首先,它研究了各种策略来扩展无监督特征选择以处理大规模和分布式数据;并研究了具有结构化特征和异步更新的分布式无监督特征选择。其次,它开发了一个家庭的异构无监督特征选择与多种类型的异质性。 第三,它定义了各种流媒体场景的无监督特征选择,并开发了新的算法来提高无监督特征选择在处理相应流媒体设置时的能力。计划采用不同的方式传播该项目及其研究结果,包括网络数据和软件储存库、书籍、期刊和会议出版物、特殊目的讲习班或教程以及外部合作。该项目融合了特征选择、大数据分析、机器学习和数据挖掘。它可以有效地整合到本科和研究生课程,以及在学生的研究项目。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jiliang Tang其他文献

DeepRobust: a Platform for Adversarial Attacks and Defenses
DeepRobust:对抗性攻击和防御的平台
Graph Trend Networks for Recommendations
用于推荐的图趋势网络
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Wenqi Fan;Xiaorui Liu;Wei Jin;Xiangyu Zhao;Jiliang Tang;Qing Li
  • 通讯作者:
    Qing Li
Social Media Data Integration for Community Detection
用于社区检测的社交媒体数据集成
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jiliang Tang;Xufei Wang;Huan Liu
  • 通讯作者:
    Huan Liu
A Robust Semantics-based Watermark for Large Language Model against Paraphrasing
一种基于语义的鲁棒抗释义大型语言模型水印
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jie Ren;Han Xu;Yiding Liu;Yingqian Cui;Shuaiqiang Wang;Dawei Yin;Jiliang Tang
  • 通讯作者:
    Jiliang Tang
Aligning large language models and geometric deep models for protein representation
将大型语言模型和几何深度学习模型用于蛋白质表征的整合(或对齐,需根据具体语境确定更准确的意思)
  • DOI:
    10.1016/j.patter.2025.101227
  • 发表时间:
    2025-05-09
  • 期刊:
  • 影响因子:
    7.400
  • 作者:
    Dong Shu;Bingbing Duan;Kai Guo;Kaixiong Zhou;Jiliang Tang;Mengnan Du
  • 通讯作者:
    Mengnan Du

Jiliang Tang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jiliang Tang', 18)}}的其他基金

III:Medium:Computation and Communication Efficient Distributed Learning
III:中:计算与通信高效分布式学习
  • 批准号:
    2212032
  • 财政年份:
    2022
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
Travel: SDM2022 Student Travel Grant
旅行:SDM2022 学生旅行补助金
  • 批准号:
    2213055
  • 财政年份:
    2022
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Graph Neural Networks for Heterophilous Data: Advancing the Theory, Models, and Applications
合作研究:III:媒介:异质数据的图神经网络:推进理论、模型和应用
  • 批准号:
    2212144
  • 财政年份:
    2022
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: Towards Scalable and Interpretable Graph Neural Networks
III:媒介:协作研究:迈向可扩展和可解释的图神经网络
  • 批准号:
    1955285
  • 财政年份:
    2020
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Effective Labeled Data Generation via Generative Adversarial Learning
III:小:协作研究:通过生成对抗性学习有效生成标记数据
  • 批准号:
    1907704
  • 财政年份:
    2019
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Continuing Grant
CAREER: Real-World Networks: Modeling and Analysis of Signed Networks with Positive and Negative Links
职业:现实世界网络:具有正向和负向链接的签名网络的建模和分析
  • 批准号:
    1845081
  • 财政年份:
    2019
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: A General Feature Learning Framework for Dynamic Attributed Networks
III:小:协作研究:动态属性网络的通用特征学习框架
  • 批准号:
    1715940
  • 财政年份:
    2017
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
Student Activities Support at 2017 SIAM International Conference on Data Mining (SDM)
2017 SIAM 国际数据挖掘会议 (SDM) 学生活动支持
  • 批准号:
    1719275
  • 财政年份:
    2017
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: RI: Small: Unsupervised Islamicate Manuscript Transcription via Lacunae Reconstruction
合作研究:RI:小型:通过缺口重建进行无监督伊斯兰手稿转录
  • 批准号:
    2200334
  • 财政年份:
    2022
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
Collaborative Research: RI: Small: Unsupervised Islamicate Manuscript Transcription via Lacunae Reconstruction
合作研究:RI:小型:通过缺口重建进行无监督伊斯兰手稿转录
  • 批准号:
    2200333
  • 财政年份:
    2022
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Towards Unsupervised Learning on Resource Constrained Edge Devices with Novel Statistical Contrastive Learning Scheme
合作研究:CNS 核心:小型:利用新颖的统计对比学习方案在资源受限的边缘设备上实现无监督学习
  • 批准号:
    2122220
  • 财政年份:
    2021
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Towards Unsupervised Learning on Resource Constrained Edge Devices with Novel Statistical Contrastive Learning Scheme
合作研究:CNS 核心:小型:利用新颖的统计对比学习方案在资源受限的边缘设备上实现无监督学习
  • 批准号:
    2122320
  • 财政年份:
    2021
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
III: Small: DeepRep: Unsupervised Deep Representation Learning for Scientific Data Analysis and Visualization
III:小:DeepRep:用于科学数据分析和可视化的无监督深度表示学习
  • 批准号:
    2101696
  • 财政年份:
    2021
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
III: Small: Improving automation and speed of macromolecule recognition and localization in cryo-electron tomography using unsupervised deep learning
III:小:使用无监督深度学习提高冷冻电子断层扫描中大分子识别和定位的自动化程度和速度
  • 批准号:
    2007595
  • 财政年份:
    2020
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Explaining Unsupervised Learning: Combinatorial Optimization Formulations, Methods and Applications
III:小:协作研究:解释无监督学习:组合优化公式、方法和应用
  • 批准号:
    1908530
  • 财政年份:
    2019
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Continuing Grant
III: Small: Collaborative Research: Explaining Unsupervised Learning: Combinatorial Optimization Formulations, Methods and Applications
III:小:协作研究:解释无监督学习:组合优化公式、方法和应用
  • 批准号:
    1910306
  • 财政年份:
    2019
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Continuing Grant
AF: Small: Learning Theory for a Modern World: Transfer Learning, Unsupervised Learning, and Beyond Prediction
AF:小:现代世界的学习理论:迁移学习、无监督学习和超越预测
  • 批准号:
    1910321
  • 财政年份:
    2019
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
RI: Small: Collaborative Research: Unsupervised Transcription of Early Modern Documents
RI:小型:合作研究:早期现代文献的无监督转录
  • 批准号:
    1618044
  • 财政年份:
    2016
  • 资助金额:
    $ 48.04万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了