CIF: Small: Collaborative Research: Ordinal Data Compression

CIF:小型:协作研究:有序数据压缩

基本信息

项目摘要

With the emergence of Big Data platforms in social and life sciences, it is becoming of paramount importance to develop efficient lossless and lossy data compression methods catering to the need of such information systems. Although many near-optimal compression methods exist for classical text, image and video data, they tend to perform poorly on data which naturally appears in fragmented or ordered form. This is especially the case for so called ordinal data, arising in crowd-voting, recommender systems, and genome rearrangement studies. There, information is represented with respect to a ?relative,? rather than ?absolute? scale, and the particular constraints of the ordering cannot be properly captured via simple dictionary constructions. This project seeks to improve the operational performance of a number of data management, cloud computing and communication systems by developing theoretical, algorithmic and software solutions for ordinal data compaction.The main goal of the project is to develop the first general and comprehensive theoretical framework for ordinal compression. In particular, the investigators propose to investigate new distortion measures for ordinal data and rate-distortion functions for lossy ordinal compression; rank aggregation and learning methods for probabilistic ordinal models, used for ordinal clustering and quantization; and smooth compression and compressive computing in the ordinal domain. The proposed analytical framework will also allow for addressing algorithmic challenges arising in the context of compressing complete, partial and weak rankings. The accompanying software solutions are expected to find broad applications in areas as diverse as theoretical computer science (sorting, searching and selection), machine learning (clustering and learning to rank), and gene prioritization and phylogeny (reconstruction of lists of influential genes and ancestral genomes, respectively).
随着社会和生命科学领域大数据平台的出现,开发满足此类信息系统需求的高效无损和有损数据压缩方法变得至关重要。尽管对于经典文本、图像和视频数据存在许多接近最佳的压缩方法,但它们往往对自然以碎片或有序形式出现的数据表现不佳。这是特别是所谓的有序数据的情况下,出现在群众投票,推荐系统,和基因组重排研究。在那里,信息是代表相对于一个?相对的,?而不是?绝对?规模,以及排序的特定约束不能通过简单的字典构造来适当地捕获。该项目旨在通过开发有序数据压缩的理论、算法和软件解决方案,提高一些数据管理、云计算和通信系统的运行性能。该项目的主要目标是开发第一个通用和全面的有序压缩理论框架。特别是,研究人员建议调查新的失真措施有序数据和率失真函数的有损有序压缩;秩聚合和学习方法的概率有序模型,用于有序聚类和量化;和平滑压缩和压缩计算在有序域。拟议的分析框架还将允许解决在压缩完整、部分和弱排名的背景下出现的算法挑战。伴随的软件解决方案预计将在理论计算机科学(排序,搜索和选择),机器学习(聚类和学习排名)以及基因优先级和遗传学(分别重建有影响力的基因和祖先基因组的列表)等领域找到广泛的应用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Olgica Milenkovic其他文献

On the generalized Hamming weight enumerators and coset weight distributions of even isodual codes
关于偶等对码的广义汉明权重枚举器和陪集权重分布
Detection and Mapping of dsDNA Breaks using Graphene Nanopore Transistor
  • DOI:
    10.1016/j.bpj.2018.11.1580
  • 发表时间:
    2019-02-15
  • 期刊:
  • 影响因子:
  • 作者:
    Nagendra Athreya;Olgica Milenkovic;Jean-Pierre Leburton
  • 通讯作者:
    Jean-Pierre Leburton
Query-based selection of optimal candidates under the Mallows model
  • DOI:
    10.1016/j.tcs.2023.114206
  • 发表时间:
    2023-11-10
  • 期刊:
  • 影响因子:
  • 作者:
    Xujun Liu;Olgica Milenkovic;George V. Moustakides
  • 通讯作者:
    George V. Moustakides

Olgica Milenkovic的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Olgica Milenkovic', 18)}}的其他基金

Collaborative Research: CIF-Medium: Privacy-preserving Machine Learning on Graphs
合作研究:CIF-Medium:图上的隐私保护机器学习
  • 批准号:
    2402815
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: Group testing for Real-Time Polymerase Chain Reactions: From Primer Selection to Amplification Curve Analysis
合作研究:CIF:中:实时聚合酶链式反应的分组测试:从引物选择到扩增曲线分析
  • 批准号:
    2107344
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
Collaborative Research: CIF: Small: Coded String Reconstruction Problems in Molecular Storage
合作研究:CIF:小型:分子存储中的编码串重建问题
  • 批准号:
    2008125
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Medium: New Methods for Learning on Hypergraphs for Single-Cell Chromatin Data Analysis
合作研究:CIF:Medium:用于单细胞染色质数据分析的超图学习新方法
  • 批准号:
    1956384
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
CIF: Small: Collaborative Research:Leveraging Data Popularity in Distributed Storage Systems via Constrained Design Theory
CIF:小型:协作研究:通过约束设计理论利用分布式存储系统中的数据流行度
  • 批准号:
    1816913
  • 财政年份:
    2018
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
SemiSynBio: An On-Chip Nanoscale Storage System Using Chimeric DNA
SemiSynBio:使用嵌合 DNA 的片上纳米级存储系统
  • 批准号:
    1807526
  • 财政年份:
    2018
  • 资助金额:
    $ 25万
  • 项目类别:
    Continuing Grant
CIF: Small: Coding for DNA-Based Storage Systems
CIF:小型:基于 DNA 的存储系统的编码
  • 批准号:
    1618366
  • 财政年份:
    2016
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research:Synchronization and Deduplication of Distributed Coded Data: Fundamental Limits and Algorithms
CIF:小型:协作研究:分布式编码数据的同步和重复数据删除:基本限制和算法
  • 批准号:
    1526875
  • 财政年份:
    2015
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Collaborative Research: A General Theory of Group Testing for Genotyping
CIF:小型:协作研究:基因分型群体测试的一般理论
  • 批准号:
    1218764
  • 财政年份:
    2012
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
CIF: Small: Nonlinear Matrix and Tensor Completion with Applications in Systems Biology
CIF:小:非线性矩阵和张量补全及其在系统生物学中的应用
  • 批准号:
    1117980
  • 财政年份:
    2011
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343599
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Mathematical and Algorithmic Foundations of Multi-Task Learning
协作研究:CIF:小型:多任务学习的数学和算法基础
  • 批准号:
    2343600
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326622
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: NSF-AoF: CIF: Small: AI-assisted Waveform and Beamforming Design for Integrated Sensing and Communication
合作研究:NSF-AoF:CIF:小型:用于集成传感和通信的人工智能辅助波形和波束成形设计
  • 批准号:
    2326621
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312872
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Designing Plotkin Transform Codes via Machine Learning
协作研究:CIF:小型:通过机器学习设计 Plotkin 转换代码
  • 批准号:
    2312753
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
  • 批准号:
    2324396
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Maximizing Coding Gain in Coded Computing
协作研究:CIF:小型:最大化编码计算中的编码增益
  • 批准号:
    2327509
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Hypergraph Signal Processing and Networks via t-Product Decompositions
合作研究:CIF:小型:通过 t 产品分解的超图信号处理和网络
  • 批准号:
    2230161
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: Versatile Data Synchronization: Novel Codes and Algorithms for Practical Applications
合作研究:CIF:小型:多功能数据同步:实际应用的新颖代码和算法
  • 批准号:
    2312871
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了