CIF: Small: Description Length Analysis for Machine Learning and Graph Models
CIF:小型:机器学习和图模型的描述长度分析
基本信息
- 批准号:1908957
- 负责人:
- 金额:$ 48.71万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Coding, in the information theoretic sense, is the transformation of data into sequences of numbers (usually 0 and 1) so that the data can be quickly transmitted from a source to a receiver. The challenge of coding is how to find the most efficient transformation such that 1) the data can be reconstructed perfectly by the receiver, 2) the data is represented by the shortest possible sequence of numbers; the length of this sequence is called the description length. Minimizing description length is both of interest for storing and transmitting data and because the description length reveals important information about structure of data. For example, description length can be used to bound the error of a learning model in machine learning, thereby allowing the algorithm to select the best model for data classification or regression tasks. The project will expand the applications of description length to new types of problems and data. Furthermore, the project also seeks to expand the type of data traditionally considered in coding by going from sequential type to data on graphs, such as arising from social networks. The project aims to simplify the sharing and storing of scientific data by developing efficient coding methods based on graph coding and learned coding, and likewise broaden the applicability of machine learning by developing efficient methods for model selection. The project will also develop new methods for anomaly detection in graphs that have applicability in medicine such as the detection of onset seizures, power grids, and computer network security including fraudulent transactions. Model selection is a central problem in many areas of science. Minimum description length (MDL) was developed by Rissanen to provide a formal criterion for model selection. It is based on coding data losslessly together with the model describing data, and choosing the model that results in the shortest total code length. The goal of the project is to extend minimum description length in new directions by going back to basics, namely that description length is based on coding. The focus is on developing new lossless coding methods. This includes the coding of graph structures, graphs with attributes, as well as combining machine learning and source coding. The research consists of three thrusts. In the first thrust, theory and practical algorithms for learned coding, which is coding based on training data, will be developed. Learned coding will be used for model selection and hyperparameter optimization in machine learning methods. In the second thrust, coding methods for graphs will be developed and be used to select graph models of data. In the third thrust, algorithms for anomaly detection and novelty detection in graph-based data will be developed by combining learned coding and graph coding.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在信息论意义上,编码是将数据转换为数字序列(通常为0和1),以便数据可以快速从源传输到接收器。编码的挑战是如何找到最有效的变换,使得1)接收器可以完美地重建数据,2)数据由最短的可能序列表示;该序列的长度称为描述长度。最小化描述长度对于存储和传输数据都是有意义的,并且因为描述长度揭示了关于数据结构的重要信息。例如,描述长度可以用于限制机器学习中学习模型的误差,从而允许算法选择最佳模型进行数据分类或回归任务。该项目将把描述长度的应用扩展到新类型的问题和数据。此外,该项目还寻求扩大传统上在编码中考虑的数据类型,从连续类型转向图表数据,例如来自社交网络的数据。该项目旨在通过开发基于图形编码和学习编码的有效编码方法来简化科学数据的共享和存储,并通过开发有效的模型选择方法来扩大机器学习的适用性。该项目还将开发适用于医学的图形异常检测新方法,例如检测发作,电网和计算机网络安全,包括欺诈交易。模型选择是许多科学领域的核心问题。最小描述长度(MDL)是由Rissanen提出的,为模型选择提供了一个形式化的标准。它是基于编码数据的损失连同描述数据的模型,并选择模型,导致最短的总代码长度。该项目的目标是通过回归基础,即描述长度基于编码,在新的方向上扩展最小描述长度。重点是开发新的无损编码方法。这包括图结构的编码,具有属性的图,以及机器学习和源代码的结合。研究包括三个方面。在第一个推力,理论和实用算法的学习编码,这是基于训练数据的编码,将开发。学习编码将用于机器学习方法中的模型选择和超参数优化。在第二个方面,将开发图形编码方法,并用于选择数据的图形模型。在第三个重点中,将通过结合学习编码和图形编码来开发基于图形数据的异常检测和新颖性检测算法。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估而被认为值得支持。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Differential Description Length for Hyperparameter Selection in Supervised Learning
- DOI:
- 发表时间:2020-10
- 期刊:
- 影响因子:0
- 作者:M. Abolfazli;A. Høst-Madsen;June Zhang
- 通讯作者:M. Abolfazli;A. Høst-Madsen;June Zhang
Bounds for Learning Lossless Source Coding
学习无损源编码的界限
- DOI:10.1109/isit45174.2021.9517758
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Host-Madsen, Anders
- 通讯作者:Host-Madsen, Anders
Graph Coding for Model Selection and Anomaly Detection in Gaussian Graphical Models
高斯图模型中模型选择和异常检测的图编码
- DOI:10.1109/isit45174.2021.9518002
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Abolfazli, Mojtaba;Host-Madsen, Anders;Zhang, June;Bratincsak, Andras
- 通讯作者:Bratincsak, Andras
Repair of Multiple Descriptions on Distributed Storage
分布式存储多重描述修复
- DOI:
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Høst-Madsen, Anders;Yang, Heecheol;Kim, Minchul;Lee, Jungwoo
- 通讯作者:Lee, Jungwoo
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Anders Host-Madsen其他文献
Anders Host-Madsen的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Anders Host-Madsen', 18)}}的其他基金
Collaborative Research: CIF: Small: Theory for Learning Lossless and Lossy Coding
协作研究:CIF:小型:学习无损和有损编码的理论
- 批准号:
2324396 - 财政年份:2023
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
EAGER:Real Time Federated Learning using Kernel Methods
EAGER:使用核方法的实时联合学习
- 批准号:
2142987 - 财政年份:2021
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
Collaborate Research: Delay and Energy: Design Tradeoffs in Spectrally Efficient Systems
合作研究:延迟和能量:频谱效率系统的设计权衡
- 批准号:
1923751 - 财政年份:2019
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
CIF:EAGER:Information Theory Approaches for finding Atypical Sequences
CIF:EAGER:寻找非典型序列的信息论方法
- 批准号:
1434600 - 财政年份:2014
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
CIF:Small:Collaborative Research:Minimum Energy Communications in Wireless Networks
CIF:小:合作研究:无线网络中的最小能量通信
- 批准号:
1017823 - 财政年份:2010
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
Collaborative Research: Capacity and Coding in Resource-Limited Wireless Networks
合作研究:资源有限无线网络中的容量和编码
- 批准号:
0729152 - 财政年份:2007
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
SENSORS: Cooperative Diversity for Wireless Sensor Networks
传感器:无线传感器网络的协作多样性
- 批准号:
0329908 - 财政年份:2003
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
- 批准号:
2312089 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
- 批准号:
2342833 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
- 批准号:
2343062 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
- 批准号:
2403559 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
- 批准号:
24K13443 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
- 批准号:
2329908 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
- 批准号:
2331111 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331302 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331301 - 财政年份:2024
- 资助金额:
$ 48.71万 - 项目类别:
Standard Grant














{{item.name}}会员




