CAREER: Enabling high-throughput data management in scientific domains
职业:在科学领域实现高通量数据管理
基本信息
- 批准号:1253980
- 负责人:
- 金额:$ 49.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2013
- 资助国家:美国
- 起止时间:2013-06-01 至 2019-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Many scientific domains have entered a data-driven era, in which scientific discovery depends heavily on effective and efficient analysis of large-scale data generated by wet-bench experiments or computer simulations. Current database management systems (DBMSs), while being very popular in the business world, fall short in high-throughput data processing required by scientific applications. The goal of this project is to design and implement a novel data management software architecture that enables high-throughput data management services for general scientific communities. The project achieves this goal via (1) a novel one-scan-fits-all data processing framework based on repetitive scans of large data sources; (2) a query engine that leverages the massive computing power of modern Graphics Processing Units (GPU) hardware; and (3) design and implementation of algorithms for popular analytics in three scientific domains on top of the query engine to demonstrate the effectiveness and efficiency of the proposed architecture. The project also aims at building a software prototype and evaluating this prototype with real-world scientific datasets and query workloads. The project is expected to provide a highly efficient solution to satisfy the data management needs of a wide range of scientific fields. To deliver comparable performance, the proposed architecture requires only a fraction of the hardware and energy costs needed by existing systems. As a result, it has the potential to make scientific studies that are regarded as difficult or infeasible a reality. Integration of proposed research into educational endeavors that contribute to broadening the influence of computer science, nurturing the next generation of multidisciplinary scientists, and boosting the success of minority and women students in the computer science and engineering field are other broader impact activities planned.
许多科学领域已经进入了一个数据驱动的时代,在这个时代,科学发现在很大程度上依赖于对湿台式实验或计算机模拟产生的大规模数据的有效和高效分析。当前的数据库管理系统(dbms)虽然在商业世界中非常流行,但在科学应用程序所需的高吞吐量数据处理方面却存在不足。该项目的目标是设计和实现一种新颖的数据管理软件架构,为一般科学界提供高通量的数据管理服务。该项目通过以下方式实现了这一目标:(1)基于对大型数据源的重复扫描的新颖的一次扫描适用于所有数据处理框架;(2)利用现代图形处理单元(GPU)硬件的强大计算能力的查询引擎;(3)在查询引擎的基础上设计和实现了三个科学领域的流行分析算法,以证明所提出架构的有效性和效率。该项目还旨在构建一个软件原型,并用真实世界的科学数据集和查询工作负载评估这个原型。该项目有望提供一个高效的解决方案,以满足广泛的科学领域的数据管理需求。为了提供可比较的性能,所建议的体系结构只需要现有系统所需的硬件和能源成本的一小部分。因此,它有可能使被认为困难或不可行的科学研究成为现实。将拟议的研究纳入教育努力,有助于扩大计算机科学的影响,培养下一代多学科科学家,促进少数族裔和女性学生在计算机科学和工程领域的成功,是计划中的其他更广泛的影响活动。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Yicheng Tu其他文献
Introduction to special issue on scientific and statistical data management in the age of AI 2021
- DOI:
10.1007/s10619-022-07420-y - 发表时间:
2022-08-22 - 期刊:
- 影响因子:0.900
- 作者:
Qiang Zhu;Xingquan Zhu;Yicheng Tu - 通讯作者:
Yicheng Tu
Paired Swarm Optimized Relational Vector Learning for FDI Attack Detection in IoT-Aided Smart Grid
用于物联网辅助智能电网中 FDI 攻击检测的配对群优化关系向量学习
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:10.6
- 作者:
Sumarga Kumar Sah Tyagi;Rahul Yadav;D. Jain;Yicheng Tu;Weizhe Zhang - 通讯作者:
Weizhe Zhang
Query batching optimization in database systems
- DOI:
10.1016/j.cor.2020.104983 - 发表时间:
2020-09-01 - 期刊:
- 影响因子:
- 作者:
Mehrad Eslami;Vahid Mahmoodian;Iman Dayarian;Hadi Charkhgard;Yicheng Tu - 通讯作者:
Yicheng Tu
Computing Group-By and Aggregates on Massively Parallel Systems
在大规模并行系统上计算分组和聚合
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Chengcheng Mou;Minh Pham;Benjamin Hsu;Yicheng Tu - 通讯作者:
Yicheng Tu
Yicheng Tu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Yicheng Tu', 18)}}的其他基金
I-Corps: Graphics Processing Unit-Based Data Management System Software
I-Corps:基于图形处理单元的数据管理系统软件
- 批准号:
1730600 - 财政年份:2017
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
II-New: A Research Platform for Heterogeneous, Massively Parallel Computing
II-New:异构大规模并行计算研究平台
- 批准号:
1513126 - 财政年份:2015
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Making Databases Green - An Energy-Aware DBMS Approach
III:小型:协作研究:使数据库变得绿色 - 一种节能意识 DBMS 方法
- 批准号:
1117699 - 财政年份:2011
- 资助金额:
$ 49.99万 - 项目类别:
Continuing Grant
相似海外基金
CAREER: Enabling High-throughput Creep Testing of Advanced Materials through in-situ Micromechanics and Mesoscale Modeling
职业:通过原位微观力学和介观建模实现先进材料的高通量蠕变测试
- 批准号:
2340174 - 财政年份:2024
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
SBIR Phase I: Space Biobank: Enabling High Throughput Space-Based Biotech R&D
SBIR 第一阶段:太空生物库:实现高通量天基生物技术 R
- 批准号:
2419674 - 财政年份:2024
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
BEASTS-Novel Biomimetic Liver Platform for Enabling ALD Researchers
BEASTS-为 ALD 研究人员提供支持的新型仿生肝脏平台
- 批准号:
10697452 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
Understanding robust cellular information processing in complex environments and development of enabling single-cell analysis technologies
了解复杂环境中强大的细胞信息处理以及单细胞分析技术的开发
- 批准号:
10552335 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
Advanced Oncolytic Adenovirus Enabling Systemic Therapy of PDAC
先进的溶瘤腺病毒实现 PDAC 的系统治疗
- 批准号:
10566530 - 财政年份:2022
- 资助金额:
$ 49.99万 - 项目类别:
Carterra LSA for the University of Oxford - Enabling High-Throughput SPR and Antibody Characterisation
牛津大学的 Carterra LSA - 实现高通量 SPR 和抗体表征
- 批准号:
MR/X012085/1 - 财政年份:2022
- 资助金额:
$ 49.99万 - 项目类别:
Research Grant
Completion of IND-enabling studies required for first-in-human studies of a novel oral therapeutic agent for treating pulmonary fibrosis
完成用于治疗肺纤维化的新型口服治疗剂的首次人体研究所需的 IND 授权研究
- 批准号:
10384244 - 财政年份:2022
- 资助金额:
$ 49.99万 - 项目类别:
Completion of IND-enabling studies required for first-in-human studies of a novel oral therapeutic agent for treating pulmonary fibrosis
完成用于治疗肺纤维化的新型口服治疗剂的首次人体研究所需的 IND 授权研究
- 批准号:
10584585 - 财政年份:2022
- 资助金额:
$ 49.99万 - 项目类别:
National HTX Center: Enabling Access to State-of-the-Art Crystallization Capabilities
国家 HTX 中心:获得最先进的结晶能力
- 批准号:
10193844 - 财政年份:2021
- 资助金额:
$ 49.99万 - 项目类别:
National HTX Center: Enabling Access to State-of-the-Art Crystallization Capabilities
国家 HTX 中心:获得最先进的结晶能力
- 批准号:
10430163 - 财政年份:2021
- 资助金额:
$ 49.99万 - 项目类别: