III:Small: Towards Cross-Model Query Optimizations for Multi-model Heterogeneous Data Analytics
III:Small:面向多模型异构数据分析的跨模型查询优化
基本信息
- 批准号:1909875
- 负责人:
- 金额:$ 44.32万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2019
- 资助国家:美国
- 起止时间:2019-08-15 至 2023-07-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Large-scale analysis of complex, heterogeneous datasets is now an integral part of various social and natural sciences, digital journalism, law, enterprises, and numerous other application domains. Users in such fields are increasingly grappling with the need to perform holistic integrated analytics spanning a variety of data models beyond just structured or semi-structured data to include graph data, text data, etc. Such multi-model data repositories are also growing in volume due to the widespread availability of online data sources such as social media and news media, which have opened up new avenues for insight in various domains. To take advantage of these opportunities, it is necessary to develop joint understanding and processing of at least three data models - relations, graphs, and text - including their evolution over time. This project aims to enable faster and scalable cross-model data analytics.An emerging information architecture for such heterogeneous data problem is the "polystore" approach that uses multiple "uni-model" backend engines such as RDBMSs, graph DBMSs, Solr, etc., and provides a translation layer in the middle to farm out different parts of a cross-model query to different engines. This approach is gaining popularity because it allows us to exploit the full functionality and native performance of uni-model engines for the corresponding parts of the queries. Amongst polystores, there are loosely-coupled solutions that have a very thin processing layer whose task is to "stitch the parts" together, and primarily provide support for data placement, movement and transformation. This project will focus on the query architecture and optimization principles for a tighter-coupled polystore. A usable, efficient, and scalable data analytics platform for queries spanning three data models, viz., relations, graphs, and text (including temporal evolution), that arise from social media and other sources, will be designed. A cross-model dataflow optimizer will be created for this "tri-store" setting to study fundamental systems optimization principles and will be implemented within the AWESOME polystore system. Further, several novel cross-model query optimization techniques will be devised to exploit the semantics of these three data models. Special attention will be paid to the temporality of data such that the optimizations treat temporal evolution of the data as a first-class primitive and support such queries efficiently on top of the existing engines even though they may lack native support for temporal queries.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
对复杂、异构数据集的大规模分析现已成为各种社会和自然科学、数字新闻、法律、企业和许多其他应用领域不可或缺的一部分。这些领域的用户越来越需要满足执行全面集成分析的需求,这些数据模型不仅限于结构化或半结构化数据,还包括图形数据、文本数据等。由于社交媒体和新闻媒体等在线数据源的广泛可用性,此类多模型数据存储库的数量也在不断增长,这为各个领域的洞察开辟了新的途径。为了利用这些机会,有必要对至少三种数据模型(关系、图形和文本)进行联合理解和处理,包括它们随时间的演变。 该项目旨在实现更快、可扩展的跨模型数据分析。解决此类异构数据问题的一种新兴信息架构是“polystore”方法,它使用多个“单模型”后端引擎,如 RDBMS、图形 DBMS、Solr 等,并在中间提供一个转换层,将跨模型查询的不同部分分包给不同的引擎。这种方法越来越受欢迎,因为它允许我们针对查询的相应部分利用单模型引擎的完整功能和本机性能。在 Polystore 中,有一些松散耦合的解决方案,它们具有非常薄的处理层,其任务是将各个部分“缝合”在一起,并且主要为数据放置、移动和转换提供支持。该项目将重点关注紧密耦合的 Polystore 的查询架构和优化原则。将设计一个可用、高效且可扩展的数据分析平台,用于跨越来自社交媒体和其他来源的三种数据模型(即关系、图形和文本(包括时间演变))的查询。将为这个“三存储”设置创建一个跨模型数据流优化器,以研究基本的系统优化原理,并将在 AWESOME Polystore 系统中实施。此外,将设计几种新颖的跨模型查询优化技术来利用这三种数据模型的语义。我们将特别关注数据的时态性,以便优化将数据的时态演化视为一流的原语,并在现有引擎之上有效地支持此类查询,即使它们可能缺乏对时态查询的本机支持。该奖项反映了 NSF 的法定使命,并通过使用基金会的智力价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Algebraic Approach for High-level Text Analytics
高级文本分析的代数方法
- DOI:10.1145/3400903.3400926
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Zheng, Xiuwen;Gupta, Amarnath
- 通讯作者:Gupta, Amarnath
PK2G - Declarative Construction and Quality Evaluation of Knowledge Graphs from Polystores
PK2G - Polystores 知识图的声明式构建和质量评估
- DOI:
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Zheng, X;Dasgupta S;Gupta, A
- 通讯作者:Gupta, A
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Amarnath Gupta其他文献
An Optimized Tri-store System for Multi-model Data Analytics
用于多模型数据分析的优化三存储系统
- DOI:
10.48550/arxiv.2305.14391 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Xiuwen Zheng;S. Dasgupta;Arun C. S. Kumar;Amarnath Gupta - 通讯作者:
Amarnath Gupta
HIV Risk on Twitter: the Ethical Dimension of Social Media Evidence-based Prevention for Vulnerable Populations
Twitter 上的艾滋病毒风险:社交媒体针对弱势群体的循证预防的道德层面
- DOI:
10.24251/hicss.2017.216 - 发表时间:
2017 - 期刊:
- 影响因子:5.1
- 作者:
Nadir Weibel;Purvi Desai;L. Saul;Amarnath Gupta;S. Little - 通讯作者:
S. Little
MedSMan: a streaming data management system over live multimedia
MedSMan:实时多媒体流数据管理系统
- DOI:
10.1145/1101149.1101174 - 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
B. Liu;Amarnath Gupta;R. Jain - 通讯作者:
R. Jain
Augmenting Serialized Bureaucratic Data: The Case of Chinese Courts
扩充序列化官僚数据:中国法院的案例
- DOI:
- 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
Xiaohan Wu;Margaret E. Roberts;R. Stern;B. Liebman;Amarnath Gupta;Luke Sanford - 通讯作者:
Luke Sanford
Characterizing the Interaction Between Phthalocyanine Tetrasulfonates and Mammalian Prion Protein
- DOI:
10.1016/j.bpj.2010.12.3221 - 发表时间:
2011-02-02 - 期刊:
- 影响因子:
- 作者:
Iveta Sosova;Abhilash Vincent;Amarnath Gupta;Max Anikovskiy;Angela Brigley;Michael T. Woodside - 通讯作者:
Michael T. Woodside
Amarnath Gupta的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Amarnath Gupta', 18)}}的其他基金
Digital Government: Web Based Information Technologies: Advancing Federal Information Infrastructures
数字政府:基于网络的信息技术:推进联邦信息基础设施
- 批准号:
9906005 - 财政年份:1999
- 资助金额:
$ 44.32万 - 项目类别:
Continuing Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: IIS-III: Small Towards Fair Outlier Detection
协作研究:IIS-III:小到公平的异常值检测
- 批准号:
2310481 - 财政年份:2023
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
- 批准号:
2321504 - 财政年份:2023
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant
III: Small: Towards Highly Accurate Map Services
III:小:迈向高精度地图服务
- 批准号:
2203553 - 财政年份:2022
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant
III: Small: Towards Explainable Personalization
III:小:迈向可解释的个性化
- 批准号:
2007492 - 财政年份:2020
- 资助金额:
$ 44.32万 - 项目类别:
Continuing Grant
III: Small: Towards the Foundations of Training Deep Neural Networks: New Theory and Algorithms
III:小:迈向训练深度神经网络的基础:新理论和算法
- 批准号:
2008981 - 财政年份:2020
- 资助金额:
$ 44.32万 - 项目类别:
Continuing Grant
III: Small: Towards Explainable Recommendation Systems
III:小:迈向可解释的推荐系统
- 批准号:
1910154 - 财政年份:2019
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant
III: Small: Towards a Theoretical Foundation for Diffusion Source Localization
III:小:迈向扩散源定位的理论基础
- 批准号:
2003924 - 财政年份:2019
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant
III: Small: Towards Speech-Driven Multimodal Querying
III:小型:迈向语音驱动的多模式查询
- 批准号:
1816701 - 财政年份:2018
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant
III: Small: Towards Resolving Ad-hoc Concept Queries with Table Answers via Multi-source Data Mining
III:小:通过多源数据挖掘解决带有表答案的临时概念查询
- 批准号:
1815674 - 财政年份:2018
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant
III: Small: Towards a Theoretical Foundation for Diffusion Source Localization
III:小:迈向扩散源定位的理论基础
- 批准号:
1715385 - 财政年份:2017
- 资助金额:
$ 44.32万 - 项目类别:
Standard Grant














{{item.name}}会员




