BIGDATA: F: Collaborative Research: Optimizing Log-Structured-Merge-Based Big Data Management Systems
BIGDATA:F:协作研究:优化基于日志结构合并的大数据管理系统
基本信息
- 批准号:1838248
- 负责人:
- 金额:$ 60.48万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-01-01 至 2023-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Modern big data management systems support fast read and write operations based on the unique identifier (key) of a record. That is, they are fast when inserting key-value pairs, and given a key they quickly return the value associated with that key. To do so, most such systems rely on a Log-Structured-Merge Tree (LSM) structure that batches writes together before writing them to persistent storage. This project will study how to efficiently support more sophisticated operations on LSM-based storage systems, that is, operations that do not simply specify the key of a record. Examples of such operations include searching for records based instead on their location or time. By optimizing the storage and management of big data, this project has the potential to cut the storage costs and energy consumption in data centers. Further, the successful completion of this work will allow users to manage more data with the existing hardware infrastructure, which is critical given the new wave of big data being generated by sensors and the Internet-of-Things. The project will capitalize on the student diversity at two Hispanic Serving Institutions, and thus broaden the participation of under-represented groups in the research process.To support richer data modeling and querying capabilities on top of LSM key-value stores, this project will develop novel LSM indexing and access algorithms to support query plans that utilize both primary and secondary LSM components. In addition, it will design and evaluate flow control policies to dampen or eliminate the notoriously bursty data ingestion behavior that LSM-based storage structures exhibit. It will also study how to automatically and dynamically change LSM compaction policies and parameters based on the query workload. Data-semantics-aware compaction techniques will also be studied. The project will additionally develop novel LSM-aware query optimization techniques; the LSM storage layer is currently treated as a black box by most query optimizers. The planned methods will be deployed and evaluated on the open source Apache AsterixDB system.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
现代大数据管理系统支持基于记录的唯一标识符(键)的快速读写操作。也就是说,它们在插入键-值对时速度很快,并且给定一个键,它们会快速返回与该键关联的值。要做到这一点,大多数这样的系统依赖于日志结构化合并树(Log-Structured-Merge Tree,LSM)结构,该结构在将写入写入持久存储之前将写入批处理在一起。这个项目将研究如何有效地支持基于LSM的存储系统上更复杂的操作,即不简单地指定记录键的操作。这种操作的示例包括基于记录的位置或时间来搜索记录。通过优化大数据的存储和管理,该项目有可能降低数据中心的存储成本和能源消耗。此外,这项工作的成功完成将使用户能够使用现有的硬件基础设施管理更多的数据,这对于传感器和物联网产生的新一波大数据至关重要。 该项目将利用两个西班牙裔服务机构的学生多样性,从而扩大代表性不足的群体在研究过程中的参与。为了支持更丰富的数据建模和查询功能的LSM键值存储的顶部,该项目将开发新的LSM索引和访问算法,以支持查询计划,利用主要和次要的LSM组件。此外,它还将设计和评估流量控制策略,以抑制或消除基于LSM的存储结构所表现出的臭名昭著的突发数据摄取行为。还将研究如何根据查询工作负载自动动态地更改LSM压缩策略和参数。还将研究数据语义感知压缩技术。该项目还将开发新的LSM感知查询优化技术; LSM存储层目前被大多数查询优化器视为黑盒。计划中的方法将在开源Apache AsterixDB系统上部署和评估。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(12)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Design Trade-offs for a Robust Dynamic Hybrid Hash Join
- DOI:10.14778/3547305.3547327
- 发表时间:2021-12
- 期刊:
- 影响因子:0
- 作者:Shiva Jahangiri;M. Carey;J. Freytag
- 通讯作者:Shiva Jahangiri;M. Carey;J. Freytag
On Multi-Valued Indexing in AsterixDB
关于 AsterixDB 中的多值索引
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Galviso, G.;Carey, M.
- 通讯作者:Carey, M.
Multi-valued indexing in Apache AsterixDB (SI DOLAP 2022)
Apache AsterixDB 中的多值索引 (SI DOLAP 2022)
- DOI:10.1016/j.is.2022.102144
- 发表时间:2023
- 期刊:
- 影响因子:3.7
- 作者:Galvizo, Glenn;Carey, Michael J.
- 通讯作者:Carey, Michael J.
Breaking Down Memory Walls in LSM-based Storage Systems
打破基于 LSM 的存储系统中的内存墙
- DOI:10.1145/3318464.3384399
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Luo, Chen
- 通讯作者:Luo, Chen
Revisiting Runtime Dynamic Optimization for Join Queries in Big Data Management Systems
重新审视大数据管理系统中连接查询的运行时动态优化
- DOI:10.1145/3604437.3604460
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Pavlopoulou, Christina;Carey, Michael J.;Tsotras, Vassilis J.
- 通讯作者:Tsotras, Vassilis J.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Michael Carey其他文献
Patients’ attitudes to bedside teaching after the COVID-19 pandemic
- DOI:
10.1007/s11845-023-03558-5 - 发表时间:
2023-11-02 - 期刊:
- 影响因子:1.600
- 作者:
Hayley Jackson;Claire MacBride;Laura Taylor;Michael Carey;Mary F. Higgins - 通讯作者:
Mary F. Higgins
Undergraduate paramedic student competency assessment: A grounded theory study explaining how assessors in Australia and New Zealand determine student competency to practice
本科护理人员学生能力评估:一项扎根理论研究解释了澳大利亚和新西兰的评估人员如何确定学生的实践能力
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Anthony C. Smith;P. Andersen;Michael Carey - 通讯作者:
Michael Carey
Ultimate doctor liability: A myth of ignorance or myth of control?
- DOI:
10.1016/j.colegn.2009.06.003 - 发表时间:
2009-07-01 - 期刊:
- 影响因子:
- 作者:
Andrew Cashin;Michael Carey;Ngaire Watson;Greg Clark;Claire Newman;Cheryl D. Waters - 通讯作者:
Cheryl D. Waters
Staff Attitudes Regarding Permanent Expulsionary Punishment (PEP) from Australian Government Schools: Comparing Queensland with Other Jurisdictions
澳大利亚公立学校员工对永久开除处罚 (PEP) 的态度:昆士兰州与其他司法管辖区的比较
- DOI:
- 发表时间:
2021 - 期刊:
- 影响因子:0
- 作者:
Brian Higgins;Michael Carey;Peter Dunn - 通讯作者:
Peter Dunn
307. Prostate Targeted TSTA Oncolytic Adenovirus
- DOI:
10.1016/j.ymthe.2006.08.362 - 发表时间:
2006-01-01 - 期刊:
- 影响因子:
- 作者:
Makoto Sato;Steve Huyn;Russell Powell;Michael Carey;Sanjiv S. Gambhir;Lily Wu - 通讯作者:
Lily Wu
Michael Carey的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Michael Carey', 18)}}的其他基金
III: Medium: Collaborative Research: Supporting High-Value Analytics on Big Low-Value Data
III:媒介:协作研究:支持低价值大数据的高价值分析
- 批准号:
1954962 - 财政年份:2020
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
CCRI: ENS: Collaborative Research: Supporting and Sustaining Apache AsterixDB for the CISE Research Community
CCRI:ENS:协作研究:为 CISE 研究社区支持和维护 Apache AsterixDB
- 批准号:
1925610 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: F: DKM: Collaborative Research: Making Big Data Active: From Petabytes to Megafolks in Milliseconds
BIGDATA:F:DKM:协作研究:使大数据活跃起来:在毫秒内从 PB 级到百万级数据
- 批准号:
1447720 - 财政年份:2014
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
CI-ADDO-NEW: ASTERIX: A Community Software Platform for Big Data Research, Analysis, and Management
CI-ADDO-NEW:ASTERIX:用于大数据研究、分析和管理的社区软件平台
- 批准号:
1305430 - 财政年份:2013
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
DC: Large: Collaborative Research: ASTERIX: A Highly Scalable Parallel Platform for Semistructured Data Management and Analysis
DC:大型:协作研究:ASTERIX:用于半结构化数据管理和分析的高度可扩展并行平台
- 批准号:
0910989 - 财政年份:2009
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
Presidential Young Investigator Award (Computer and Information Science)
总统青年研究员奖(计算机与信息科学)
- 批准号:
8657323 - 财政年份:1987
- 资助金额:
$ 60.48万 - 项目类别:
Continuing Grant
The Performance of Algorithms For Shared Relational DatabaseSystems
共享关系数据库系统算法的性能
- 批准号:
8402818 - 财政年份:1984
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
相似国自然基金
微尺度光-酶协同催化流动反应过程及其强化机制研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
高温蠕变与疲劳协同作用下多裂纹扩展寿命算法研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于复合相变界面材料及微通道结构调控协同散热研究
- 批准号:JCZRLH202500111
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于等离子体协同催化的氨燃料重整技术研究
- 批准号:JCZRLH202500823
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
抑制GLRX2协同雄激素疗法治疗去势抵抗性前列腺癌的机制研究
- 批准号:JCZRLH202500112
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
酵母可溶性多糖协同益生菌增效机制的研究
- 批准号:JCZRLH202500927
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
磁场诱导二维材料光催化析氢与热电输运性能协同增强研究
- 批准号:JCZRLH202501259
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
北斗星地协同地质灾害智慧防控和应急技术研究
- 批准号:JCZRLH202500581
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
面向具身智能的灵巧手多指协同主动触觉感知机制研究
- 批准号:JCZRQN202500196
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
镁碳耐火材料中Fe2AlB2-Al2O3复合粉体物相重构协同强韧化及材料抗渣侵蚀机理研究
- 批准号:JCZRQN202500380
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
2348159 - 财政年份:2023
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
- 批准号:
2308649 - 财政年份:2022
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: Collaborative Research: F: Holistic Optimization of Data-Driven Applications
BIGDATA:协作研究:F:数据驱动应用程序的整体优化
- 批准号:
2027516 - 财政年份:2020
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: F: Collaborative Research: Practical Analysis of Large-Scale Data with Lyme Disease Case Study
BIGDATA:F:协作研究:莱姆病案例研究大规模数据的实际分析
- 批准号:
1934319 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Protecting Yourself from Wildfire Smoke: Big Data-Driven Adaptive Air Quality Prediction Methodologies
大数据:IA:协作研究:保护自己免受野火烟雾的侵害:大数据驱动的自适应空气质量预测方法
- 批准号:
1838022 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: F: Collaborative Research: Foundations of Responsible Data Management
大数据:F:协作研究:负责任的数据管理的基础
- 批准号:
1926250 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Intelligent Solutions for Navigating Big Data from the Arctic and Antarctic
BIGDATA:IA:协作研究:导航北极和南极大数据的智能解决方案
- 批准号:
1947584 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
1837964 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: F: Collaborative Research: Optimizing Log-Structured-Merge-Based Big Data Management Systems
BIGDATA:F:协作研究:优化基于日志结构合并的大数据管理系统
- 批准号:
1838222 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant
BIGDATA: IA: Collaborative Research: Asynchronous Distributed Machine Learning Framework for Multi-Site Collaborative Brain Big Data Mining
BIGDATA:IA:协作研究:用于多站点协作大脑大数据挖掘的异步分布式机器学习框架
- 批准号:
1837956 - 财政年份:2019
- 资助金额:
$ 60.48万 - 项目类别:
Standard Grant