CIF: Small: Info-Clustering: An Information-Theoretic Framework for Data Clustering

CIF:小型:信息聚类:数据聚类的信息理论框架

基本信息

  • 批准号:
    1719017
  • 负责人:
  • 金额:
    $ 43.93万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-07-01 至 2021-06-30
  • 项目状态:
    已结题

项目摘要

Clustering refers to a procedure that groups similar objects together while separating dissimilar ones apart. This simple idea has a wide range of applications in different areas of scientific research. From the mathematical viewpoint, the problem of clustering is quite unique in that it attempts to discover unknown patterns of data without a clear knowledge of the ground truth. Instead of jumping to a specific algorithm or a dataset (which is a common practice in the literature), this research aims to lay a rigorous theoretical ground, upon which many meaningful and practical implementations can be developed subsequently. This research is accompanied by the investigator's continuing effort in curriculum development, involving undergraduate and graduate students in research, and broadening the participation of women and underrepresented minorities in engineering.To achieve the aforementioned goal, the investigator plans to take an information-theoretic view of the data clustering problem by modeling each object to be clustered as a piece of information. A key advantage of this information-theoretic view is that now the similarity among multiple objects can be naturally measured by the amount of shared information. This is precisely where information theory, with the accumulation of over 70 years of active research, can be most useful. The main agendas of this research are to understand: 1) what clustering algorithms can be derived from the proposed info-clustering framework by leveraging the large body of literature on multivariate dependency modeling including graphical models and parameter families; 2) whether the proposed info-clustering framework can be leveraged to make some progress on the long-standing open problem of subset feature selection in statistics and machine learning.
聚类是指将相似的对象分组在一起,同时将不同的对象分开的过程。这个简单的想法在不同的科学研究领域有着广泛的应用。从数学的观点来看,聚类问题是非常独特的,因为它试图在不清楚基本事实的情况下发现未知的数据模式。本研究的目的不是跳到特定的算法或数据集(这是文献中的常见做法),而是奠定严格的理论基础,在此基础上可以开发许多有意义和实用的实现。这项研究伴随着调查者在课程开发方面的持续努力,让本科生和研究生参与研究,并扩大女性和未被充分代表的少数群体参与工程。为了实现上述目标,调查者计划从信息论的角度看待数据聚集问题,将每个对象建模为一条信息。这种信息论观点的一个关键优势是,现在可以通过共享信息量来自然地衡量多个对象之间的相似性。这正是经过70多年积极研究积累的信息论最有用的地方。本研究的主要目的是了解:1)利用包括图形模型和参数家族在内的多变量相关性建模的大量文献,可以从所提出的信息聚类框架中得到什么聚类算法;2)所提出的信息聚类框架是否可以用于解决统计学和机器学习中长期悬而未决的子集特征选择问题。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Convex clustering with metric learning
  • DOI:
    10.1016/j.patcog.2018.04.019
  • 发表时间:
    2018-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xiaopeng Lucia Sui;Li Xu;Xiaoning Qian;Tie Liu
  • 通讯作者:
    Xiaopeng Lucia Sui;Li Xu;Xiaoning Qian;Tie Liu
Individually Conditional Individual Mutual Information Bound on Generalization Error
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Tie Liu其他文献

ATOMS: ALMA three-millimetre observations of massive star-forming regions – XIV. Properties of resolved ultra-compact H ii regions
原子:ALMA 对大质量恒星形成区域的三毫米观测 – XIV 解析的超致密 H ii 区域的特性。
  • DOI:
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    4.8
  • 作者:
    C. Zhang;Feng;Tie Liu;Z. Ren;H. ;Ke Wang;J. Wu;Y. Zhang;J. Zhou;K. Tatematsu;G. Garay;A. Tej;Shanghuo Li;W. Xu;Chang Won Lee;L. Bronfman;A. Soam;D. Li
  • 通讯作者:
    D. Li
Effect of cooling rate on magnetic domain structure and magnetic properties of Tb0.27Dy0.73Fe1.95 alloys solidified in high magnetic field
冷却速率对高磁场凝固Tb0.27Dy0.73Fe1.95合金磁畴结构和磁性能的影响
  • DOI:
    10.1063/1.5004020
  • 发表时间:
    2018-01
  • 期刊:
  • 影响因子:
    1.6
  • 作者:
    Tie Liu;Meng Doneg;Pengfei Gao;Yubao Xiao;Yi Yuan;Qiang Wang
  • 通讯作者:
    Qiang Wang
Polyhedral description of the symmetrical latency capacity region of broadcast channels
广播信道对称延迟容量区域的多面体描述
Coding for parallel Gaussian bi-directional relay channels: A deterministic approach
并行高斯双向中继通道的编码:确定性方法
Formation and Eruption of a Mini-sigmoid Originating in Coronal Hole
起源于冕洞的迷你乙状结肠的形成与喷发
  • DOI:
    10.3847/1538-4357/ab4f83
  • 发表时间:
    2019-12
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ziwen Huang;Xin Cheng;Yang Su;Tie Liu;Mingde Ding
  • 通讯作者:
    Mingde Ding

Tie Liu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Tie Liu', 18)}}的其他基金

CIF: Small: Collaborative Research: Fundamental Limits of Information Systems: A Computational Approach
CIF:小型:协作研究:信息系统的基本限制:计算方法
  • 批准号:
    1524839
  • 财政年份:
    2015
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
CIF: Small: Structured-Network Coding: Fundamental Limits via Submodular Function Optimization
CIF:小型:结构化网络编码:通过子模函数优化实现基本限制
  • 批准号:
    1320237
  • 财政年份:
    2013
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
CAREER: Information Theory and Coding for Wireless Broadcast Networks
职业:无线广播网络的信息论和编码
  • 批准号:
    0845848
  • 财政年份:
    2009
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: Wireless Networks: Fundamental Limits via Extremal Entropy Properties
CIF:小型:协作研究:无线网络:通过极值熵属性实现基本限制
  • 批准号:
    0916867
  • 财政年份:
    2009
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
  • 批准号:
    10099896
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
  • 批准号:
    AH/X011747/1
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
  • 批准号:
    MR/Z503757/1
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
  • 批准号:
    BB/Y004426/1
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
  • 批准号:
    ST/Z000017/1
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 43.93万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了