EAGER: AF:Small: Algorithms for Relational Machine Learning
EAGER:AF:Small:关系机器学习算法
基本信息
- 批准号:2036077
- 负责人:
- 金额:$ 14.88万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-10-01 至 2023-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Relational database-management systems constitute a mature, ubiquitous, sophisticated technology that is deeply entrenched. Seemingly all organizations are collecting vastly increasing volumes of structured as well as unstructured data, and want to extract knowledge from this data using machine-learning techniques/algorithms. Thus many learning tasks faced by working data scientists involve relational data. Thus a marriage of machine learning and relational databases seems inevitable. However, standard machine-learning algorithms are not designed to operate directly on relational data, and further, it is far from obvious if and how one can adapt many of these algorithms to work on relational data without suffering a significant loss of efficiency. The current standard practice for a data scientist, confronted with a machine-learning task on relational data, is to issue a feature-extraction query to extract the (carefully curated) data from the relational database by joining together multiple tables to create a design matrix, and then to import this design matrix into some machine-learning tool to train the model. This standard practice is wasteful because (1) computing relational joins is computationally expensive, both in terms of time and space, (2) the resulting design matrix will likely contain much redundant information and consume much more space than the original tables, and thus (3) the machine-learning task takes more time than should conceptually be necessary. Algorithms that are orders of magnitude faster for standard machine-learning problems on relational data are certain to exist, and the goal of this research program is to discover them. Such algorithms would allow the extraction of information from data that is now not currently feasibly extractable.The research goals of this project are threefold. The first goal is to design and analyze relational algorithms for common machine-learning queries. A relational algorithm works directly on the relational data, without forming the design matrix, and can be orders of magnitude faster than standard machine-learning practice for such data. The second goal is to design a layer of relational algorithms for commonly arising subproblems and that can be utilized by the data scientists as a sort of middleware toolkit when designing their algorithms. The third goal is to build some intuition as to what problems are, and are not, solvable by relational algorithms and that researchers/practitioners can rely on when faced with a new problem. These goals will require the development of new algorithmic-design and -analysis techniques.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
关系数据库管理系统构成了一种成熟的、无处不在的、复杂的、根深蒂固的技术。似乎所有组织都在收集大量的结构化和非结构化数据,并希望使用机器学习技术/算法从这些数据中提取知识。因此,数据科学家面临的许多学习任务都涉及到关系数据。因此,机器学习和关系数据库的结合似乎是不可避免的。然而,标准的机器学习算法并不是为直接操作关系数据而设计的,而且,如果以及如何在不遭受显著效率损失的情况下调整许多这些算法来处理关系数据还远远不明显。数据科学家在面对关系数据的机器学习任务时,目前的标准做法是发出一个特征提取查询,通过将多个表连接在一起创建设计矩阵,从关系数据库中提取(精心策划的)数据,然后将该设计矩阵导入某些机器学习工具以训练模型。这种标准实践是浪费的,因为(1)计算关系连接在计算上是昂贵的,无论是在时间和空间方面,(2)最终的设计矩阵可能包含许多冗余信息,并且比原始表消耗更多的空间,因此(3)机器学习任务花费的时间比概念上必要的时间要多。在关系型数据的标准机器学习问题上,速度快几个数量级的算法肯定是存在的,而本研究项目的目标就是发现它们。这样的算法将允许从目前无法提取的数据中提取信息。这个项目的研究目标有三个方面。第一个目标是为常见的机器学习查询设计和分析关系算法。关系算法直接在关系数据上工作,而不形成设计矩阵,并且可以比此类数据的标准机器学习实践快几个数量级。第二个目标是为经常出现的子问题设计一层关系算法,数据科学家在设计算法时可以将其用作一种中间件工具包。第三个目标是建立一些直觉,了解哪些问题可以用关系算法解决,哪些问题不能用关系算法解决,研究人员/从业者在面临新问题时可以依靠这些直觉。这些目标将需要开发新的算法设计和分析技术。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(6)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Relational Algorithms for k-means Clustering
- DOI:10.4230/lipics.icalp.2021.97
- 发表时间:2020-08
- 期刊:
- 影响因子:0
- 作者:Benjamin Moseley;K. Pruhs;Alireza Samadian;Yuyan Wang
- 通讯作者:Benjamin Moseley;K. Pruhs;Alireza Samadian;Yuyan Wang
Instance Optimal Join Size Estimation
实例最佳连接大小估计
- DOI:10.1016/j.procs.2021.11.019
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Abo-Khamis, Mahmoud;Im, Sungjin;Moseley, Benjamin;Pruhs, Kirk;Samadian, Alireza
- 通讯作者:Samadian, Alireza
An Approximation Algorithm for the Matrix Tree Multiplication Problem
- DOI:10.4230/lipics.mfcs.2021.6
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Mahmoud Abo Khamis;Ryan R. Curtin;Sungjin Im;Benjamin Moseley;H. Ngo;K. Pruhs;Alireza Samadian
- 通讯作者:Mahmoud Abo Khamis;Ryan R. Curtin;Sungjin Im;Benjamin Moseley;H. Ngo;K. Pruhs;Alireza Samadian
Unconditional Coresets for Regularized Loss Minimization
- DOI:
- 发表时间:2020-06
- 期刊:
- 影响因子:0
- 作者:Alireza Samadian;K. Pruhs;Benjamin Moseley;Sungjin Im;Ryan R. Curtin
- 通讯作者:Alireza Samadian;K. Pruhs;Benjamin Moseley;Sungjin Im;Ryan R. Curtin
A Relational Gradient Descent Algorithm For Support Vector Machine Training
支持向量机训练的关系梯度下降算法
- DOI:10.1137/1.9781611976489.8
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Abo-Khamis, M.;Im, S.;Moseley, B.;Pruhs, K.;Samadian, A.
- 通讯作者:Samadian, A.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Kirk Pruhs其他文献
Foreword of the Special Issue Dedicated to the 2013 Workshop on Approximation and Online Algorithms
- DOI:
10.1007/s00224-015-9619-3 - 发表时间:
2015-04-08 - 期刊:
- 影响因子:0.400
- 作者:
Christos Kaklamanis;Kirk Pruhs - 通讯作者:
Kirk Pruhs
Network awareness and application adaptability
- DOI:
10.1007/s10257-005-0012-7 - 发表时间:
2006-06-09 - 期刊:
- 影响因子:3.600
- 作者:
Ahmad T. Al-Hammouri;Wenhui Zhang;Robert F. Buchheit;Vincenzo Liberatore;Panos K. Chrysanthis;Kirk Pruhs - 通讯作者:
Kirk Pruhs
Editorial: Special Issue on On-Line Scheduling
- DOI:
10.1023/a:1022992023381 - 发表时间:
2003-05-01 - 期刊:
- 影响因子:1.800
- 作者:
Kirk Pruhs;Bala Kalayansundaram - 通讯作者:
Bala Kalayansundaram
A $${o}\mathopen {}\left( n\right) \mathclose {}$$ -Competitive Deterministic Algorithm for Online Matching on a Line
- DOI:
10.1007/s00453-019-00565-w - 发表时间:
2019-03-22 - 期刊:
- 影响因子:0.700
- 作者:
Antonios Antoniadis;Neal Barcelo;Michael Nugent;Kirk Pruhs;Michele Scquizzato - 通讯作者:
Michele Scquizzato
The Power of Fair Pricing Mechanisms
- DOI:
10.1007/s00453-011-9587-1 - 发表时间:
2011-11-18 - 期刊:
- 影响因子:0.700
- 作者:
Christine Chung;Katrina Ligett;Kirk Pruhs;Aaron Roth - 通讯作者:
Aaron Roth
Kirk Pruhs的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Kirk Pruhs', 18)}}的其他基金
AF:Small: Algorithmic Management of Heterogeneous Resources
AF:Small:异构资源的算法管理
- 批准号:
1907673 - 财政年份:2019
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AitF: EXPL: Data Management in Domain Wall Memory-based Scratchpad for High Performance Mobile Devices
AitF:EXPL:用于高性能移动设备的基于域墙内存的便签本中的数据管理
- 批准号:
1535755 - 财政年份:2015
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AF: Small: Algorithmic Energy Management in New Information Technologies
AF:小:新信息技术中的算法能源管理
- 批准号:
1421508 - 财政年份:2014
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
EAGER: A Framework for joint optimization of power management and performance in virtualized, heterogeneous cloud computing environments
EAGER:虚拟化异构云计算环境中电源管理和性能联合优化的框架
- 批准号:
1253218 - 财政年份:2012
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AF: Small: Green Computing Algorithmics
AF:小型:绿色计算算法
- 批准号:
1115575 - 财政年份:2011
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Algorithmic Support for Power Management
电源管理的算法支持
- 批准号:
0830558 - 财政年份:2008
- 资助金额:
$ 14.88万 - 项目类别:
Continuing Grant
Collaborative Research: Algorithmic Support for Power Aware Computing and Communication
协作研究:功耗感知计算和通信的算法支持
- 批准号:
0514058 - 财政年份:2005
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Algorithmic Support for Temperature Aware Computing and Networking
温度感知计算和网络的算法支持
- 批准号:
0448196 - 财政年份:2004
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
相似国自然基金
基于前瞻性队列的双酚AF联合果糖加重代谢损伤的靶向代谢组学研究
- 批准号:2025JJ30049
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
U2AF2-circMMP1信号轴促进结直肠癌进展的分子机制研究
- 批准号:2025JJ80723
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
U2AF2精氯酸甲基化调控RNA转录合成在MTAP缺失骨肉瘤T细胞耗竭中的机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0 万元
- 项目类别:青年科学基金项目
BDA-366通过MYD88/NF-κB/PGC1β通路杀伤 KMT2A/AF9 AML细胞的机制研究
- 批准号:
- 批准年份:2024
- 资助金额:15.0 万元
- 项目类别:省市级项目
Lu AF21934减少缺血性脑卒中导致的神经损伤的机制研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
H2S介导剪接因子BraU2AF65a的S-巯基化修饰促进大白菜开花的分子机制
- 批准号:32372727
- 批准年份:2023
- 资助金额:50 万元
- 项目类别:面上项目
AF9通过ARRB2-MRGPRB2介导肠固有肥大细胞活化促进重症急性胰腺炎发生MOF的研究
- 批准号:82300739
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
剪接因子U2AF1突变在急性髓系白血病原发耐药中的机制研究
- 批准号:82370157
- 批准年份:2023
- 资助金额:49 万元
- 项目类别:面上项目
线粒体活性氧介导的胎盘早衰在孕期双酚AF暴露致婴幼儿神经发育迟缓中的作用
- 批准号:82304160
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
U2AF2-circMMP1调控能量代谢促进结直肠癌肝转移的分子机制
- 批准号:82303789
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
相似海外基金
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342244 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Exploring the Frontiers of Adversarial Robustness
合作研究:AF:小型:探索对抗鲁棒性的前沿
- 批准号:
2335411 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
NSF-BSF: Collaborative Research: AF: Small: Algorithmic Performance through History Independence
NSF-BSF:协作研究:AF:小型:通过历史独立性实现算法性能
- 批准号:
2420942 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Structural Graph Algorithms via General Frameworks
合作研究:AF:小型:通过通用框架的结构图算法
- 批准号:
2347322 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Real Solutions of Polynomial Systems
合作研究:AF:小:多项式系统的实数解
- 批准号:
2331401 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402572 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AF: SMALL: Submodular Functions and Hypergraphs: Partitioning and Connectivity
AF:SMALL:子模函数和超图:分区和连接
- 批准号:
2402667 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342245 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant
AF: Small: Memory Bounded Optimization and Learning
AF:小:内存限制优化和学习
- 批准号:
2341890 - 财政年份:2024
- 资助金额:
$ 14.88万 - 项目类别:
Standard Grant