CAREER: Speedy and Reliable Approximate Queries in Hybrid Transactional/Analytical Systems
职业:混合事务/分析系统中快速可靠的近似查询
基本信息
- 批准号:2339596
- 负责人:
- 金额:$ 60万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2024
- 资助国家:美国
- 起止时间:2024-05-15 至 2029-04-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Real-time data analytics allow one to extract timely insights from today’s large and rapidly growing databases, which can provide important economic and social values. Examples include fraud detection using online financial transaction data, optimizing marketing strategies based on analysis of real time data, etc. A new type of database system called Hybrid Transactional/Analytical Processing (HTAP) is built to perform these analytical queries over online transactional databases with low response time, but they require increasing computation resources and may still have prolonged query response time as the data continue to grow rapidly. Approximate Query Processing (AQP) techniques can significantly reduce query response time by performing random sampling in the query processing pipelines, but they are only designed for static databases that cannot be updated online. This project seeks to support scalable real-time data analytics on large and rapidly growing databases, by enabling speedy and reliable AQP capabilities in HTAP systems. The project will result in an open-source system that supports approximate real-time data analytics, and thus can potentially enable the aforementioned real-time data analytics applications. Furthermore, this project will also support the development of new educational materials on modern data management systems, include HTAP and AQP systems, as well as research training of undergraduate and graduate students, to improve the readiness of the STEM workforce. In addition, it will also support development of educational materials in data management for K-12 outreach programs and improve the public awareness of database technologies.Existing HTAP systems perform exact query processing, which incurs at least linear computation cost to input size, and are no longer a viable solution as the rapid growth of data has outpaced limited increase in processor speed and storage bandwidth. Approximate Query Processing (AQP) is a fast alternative that may achieve sublinear time cost if the application can tolerate approximation, but the existing techniques suffer from several drawbacks including high data scan cost, inability to perform correct and efficient transactional updates, as well as inaccurate estimation and unreliable error diagnosis results. This project aims to resolve these drawbacks through a co-design of AQP and HTAP system components including data storage and indexing layer, transaction concurrency control protocols and approximate query processing algorithms. Specifically, this project will result in three main scientific contributions: (1) It will develop a thread-safe, high-performance, and succinct sampling index design for HTAP storage. It will provide the necessary thread-safe atomic update and fast sampling capabilities for enabling speedy and reliable AQP in HTAP systems. (2) It will design new protocols to enforce snapshot isolation and serializability for database transactions with mixed updates and approximate queries. (3) It will also investigate a new sampling strategy leveraging the fast-sampling capabilities to minimize approximate query latency given a user-specified confidence bound target, and a background diagnosis service for reliably diagnosing estimation failures where the true answer does not fall into the estimated confidence interval with the user-specified confidence.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
实时数据分析允许人们从当今快速增长的大型数据库中提取及时的见解,这些数据库可以提供重要的经济和社会价值。实例包括使用在线金融交易数据的欺诈检测、基于对真实的时间数据的分析来优化营销策略等。构建称为混合事务/分析处理(HTAP)的新型数据库系统以在具有低响应时间的在线事务数据库上执行这些分析查询,但是它们需要增加的计算资源,并且随着数据继续快速增长,它们可能仍然具有延长的查询响应时间。近似查询处理(AQP)技术可以通过在查询处理管道中执行随机采样来显着减少查询响应时间,但它们仅针对无法在线更新的静态数据库而设计。该项目旨在通过在HTAP系统中实现快速可靠的AQP功能,支持大型和快速增长的数据库的可扩展实时数据分析。该项目将产生一个支持近似实时数据分析的开源系统,从而有可能实现上述实时数据分析应用程序。此外,该项目还将支持开发关于现代数据管理系统的新教材,包括HTAP和AQP系统,以及本科生和研究生的研究培训,以提高STEM劳动力的准备程度。此外,它还将支持K-12推广计划的数据管理教育材料的开发,并提高公众对数据库技术的认识。现有的HTAP系统执行精确的查询处理,这至少会导致输入大小的线性计算成本,并且不再是一个可行的解决方案,因为数据的快速增长已经超过了处理器速度和存储带宽的有限增长。近似查询处理(AQP)是一种快速的替代方案,可以实现次线性的时间成本,如果应用程序可以容忍近似,但现有的技术遭受几个缺点,包括高数据扫描成本,无法执行正确和有效的事务更新,以及不准确的估计和不可靠的错误诊断结果。该项目旨在通过AQP和HTAP系统组件的协同设计来解决这些缺点,包括数据存储和索引层,事务并发控制协议和近似查询处理算法。具体而言,本项目将产生三个主要的科学贡献:(1)它将为HTAP存储开发线程安全,高性能和简洁的采样索引设计。它将提供必要的线程安全原子更新和快速采样功能,以在HTAP系统中实现快速可靠的AQP。(2)它将设计新的协议,以加强快照隔离和数据库事务与混合更新和近似查询的可串行化。(3)它还将研究一种新的采样策略,该策略利用快速采样功能来最小化给定用户指定的置信度界限目标的近似查询延迟,以及后台诊断服务,用于可靠地诊断真实答案没有落入用户的估计置信区间的估计失败,该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Zhuoyue Zhao其他文献
Efficient Join Synopsis Maintenance for Data Warehouse
数据仓库的高效连接概要维护
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
Zhuoyue Zhao;Feifei Li;Yuxi Liu - 通讯作者:
Yuxi Liu
AB-tree: Index for Concurrent Random Sampling and Updates
AB 树:并发随机采样和更新的索引
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:2.5
- 作者:
Zhuoyue Zhao;Dong Xie;Feifei Li - 通讯作者:
Feifei Li
Zhuoyue Zhao的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
面向在役损伤结构快速修复的磷酸镁水泥腐蚀防护性能与调控
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
机器学习辅助的新型纸基传感阵列用于农药残留的快速检测与识别研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
周期结构中电磁散射问题的理论、算法及应用
- 批准号:RG25A010002
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
多重免扩增CRISPR技术与自驱动双模态可视化检测方法及其在奶牛乳腺炎快速诊断中的应用
- 批准号:Z25C130028
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
高容量快充钠离子电池层状氧化物正极的设计与构效关系研究
- 批准号:QN25B060022
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
聚集诱导发光材料选择性标识病原菌快速诊断感染性角膜炎的应用及机制
- 批准号:2025JJ90150
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
脓毒症致多器官功能障碍病原体快速检测和预警体系建立的关键技术研究与应用
- 批准号:2025JJ90185
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于菌群多通道阵列传感器构建结直肠癌快速筛查方法研究
- 批准号:2025JJ90216
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于MBT-ASTRA技术的智能质谱检测系统研制及其在细菌耐药表型快速检测中的应用
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于快速量子绝热驱动的金刚石色心量子传感
- 批准号:
- 批准年份:2025
- 资助金额:10.0 万元
- 项目类别:省市级项目
相似海外基金
水だけを溶媒とするグリーンで迅速な食品残留分析技術の創出
创造仅用水作为溶剂的绿色快速食品残留分析技术
- 批准号:
23K21179 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
採血後4hでの起炎菌迅速同定・定量検査法を用い「菌数」をバイオマーカーとする研究
以“细菌计数”为生物标志物的研究,在采血后 4 小时内快速鉴定和定量检测病原菌
- 批准号:
23K21403 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
高機能等温核酸増幅酵素の創製と構造解析および病原体の現場での迅速検出への応用
高性能等温核酸扩增酶的构建、结构分析及其在病原快速现场检测中的应用
- 批准号:
23K24590 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
B型肝炎エリミネーションを目指した高感度B型肝炎コア関連抗原・簡易迅速検査の開発
开发高度敏感的乙型肝炎核心相关抗原/旨在消除乙型肝炎的简单快速检测
- 批准号:
24K13442 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
迅速かつ正確な遺伝子改変マウスの作製によるてんかんにおける多相遺伝的な病態の解明
通过快速准确地培育转基因小鼠来阐明癫痫的多相遗传病理学
- 批准号:
24K11014 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
迅速な分子同定基盤に基づくp53凝集阻害物質の開発を目指した天然物創薬
基于快速分子鉴定平台的天然产物药物发现,旨在开发p53聚集抑制剂
- 批准号:
24K18297 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
分単位の迅速な小胞体リモデリングの分子基盤と生理的意義の解明
阐明几分钟内快速内质网重塑的分子基础和生理意义
- 批准号:
24K09365 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
男性特異的な核酸マーカーの迅速・簡便なオンサイト検出法の確立
快速简便的男性特异性核酸标记物现场检测方法的建立
- 批准号:
24H02720 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Encouragement of Scientists
オゾン反応を利用したヨウ素・アクチニド微量元素の迅速超高感度質量分析法の開拓
臭氧反应快速超灵敏质谱测定碘和锕系微量元素的研究
- 批准号:
24K01394 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
核酸アプタマーと機械学習を利用する血液凝固因子欠損症の高精度迅速診断
利用核酸适体和机器学习高精度、快速诊断凝血因子缺乏症
- 批准号:
24K01507 - 财政年份:2024
- 资助金额:
$ 60万 - 项目类别:
Grant-in-Aid for Scientific Research (B)