CAREER: Reliable and Efficient Data Encoding for Extreme-Scale Simulation and Analysis
职业:用于超大规模仿真和分析的可靠且高效的数据编码
基本信息
- 批准号:1751143
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2018
- 资助国家:美国
- 起止时间:2018-04-15 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Transformative research in science and engineering to address challenges of our time, such as designing new combustion systems, depends on progressively sophisticated computational models and simulations that operate on high performance computing systems. These simulations and analyses are increasingly constrained by the massive volumes of data that they must use, generate, and analyze. To manage this enormous amount of data, this project explores innovative mechanisms to optimize the performance of these simulations by reducing data movement and maximizing the use of computing power, while minimizing errors and information loss. Such performance improvements support NSF's mission to advance emerging, data-intensive science discovery and contribute to solving the world's most pressing and complex contemporary science and engineering problems. This project implements comprehensive outreach and education to train the next-generation of professional workers and researchers in the latest computing architectures and programming methodologies, and provides rich opportunities for student engagement, research, and employment. It leverages multiple campus and national resources and implements proven, research-based interventions to attract, retain, and educate female and underrepresented minority populations in computer engineering, which furthers the US national goal of increased participation in engineering. The research goal of this project is to adapt techniques and formats for compressing video data to the investigation of novel data encoding and decoding schemes to optimize data movement and computation in data-intensive simulation and analyses. Innovative new mechanisms have the potential to efficiently reduce the volume of data generated and transferred while also enabling rapid execution of various analysis kernels using compressed data, and permitting seamless scaling of their performance on current and future extreme-scale platforms. The research objectives are to investigate data encoding/decoding of scientific datasets and harness encoded data, employ and scale encoded datasets seamlessly within current extreme-scale scientific workflows, and optimize machine learning and data mining algorithms with the goal of maximizing the use of computing power while minimizing errors. These new mechanisms are applied to an evaluation framework and validated on multiple extreme-scale data-driven scientific applications, including climate, multiphysics, and fluid dynamics. This approach is expected to transform data representation and encoding while incurring minimal disturbance to existing applications, responding to the trends in hardware architecture and dataset characteristics. It is anticipated to improve the overall performance of computational scientists' workloads by reducing defensive and productive I/O costs, respectively, up to 100x and 200x data reduction spatially and temporally, potentially resulting in up to an overall 50x I/O cost improvement. The project leverages multiple collaborations in order to establish the governing principles for system co-design and scalable system software layers for better data encoding within world-class computational infrastructures. This project strengthens the University of Massachusetts Lowell computer engineering curriculum, broadens participation in computer engineering, and creates a collaborative, interdisciplinary research program geared toward exploiting ever-evolving computing paradigms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
科学和工程领域的变革性研究以应对我们这个时代的挑战,例如设计新的燃烧系统,这取决于在高性能计算系统上运行的日益复杂的计算模型和模拟。 这些模拟和分析越来越受到它们必须使用、生成和分析的大量数据的限制。 为了管理如此庞大的数据量,该项目探索了创新机制,通过减少数据移动和最大限度地利用计算能力,同时最大限度地减少错误和信息丢失,来优化这些模拟的性能。 这些性能改进支持NSF的使命,即推进新兴的数据密集型科学发现,并为解决世界上最紧迫和最复杂的当代科学和工程问题做出贡献。 该项目实施全面的推广和教育,以培训下一代专业工作者和研究人员掌握最新的计算架构和编程方法,并为学生参与,研究和就业提供丰富的机会。 它利用多个校园和国家资源,并实施经过验证的,基于研究的干预措施,以吸引,留住和教育女性和代表性不足的少数民族人口在计算机工程,这进一步促进了美国国家目标的增加参与工程。本项目的研究目标是使视频数据压缩技术和格式适应于新型数据编码和解码方案的研究,以优化数据密集型仿真和分析中的数据移动和计算。 创新的新机制有可能有效地减少生成和传输的数据量,同时还可以使用压缩数据快速执行各种分析内核,并允许在当前和未来的极端规模平台上无缝扩展其性能。 研究目标是研究科学数据集的数据编码/解码,利用编码数据,在当前极端规模的科学工作流程中无缝地使用和扩展编码数据集,并优化机器学习和数据挖掘算法,以最大限度地利用计算能力,同时最大限度地减少错误。 这些新机制应用于评估框架,并在多个极端尺度数据驱动的科学应用中得到验证,包括气候,多物理场和流体动力学。 这种方法有望改变数据表示和编码,同时对现有应用程序的干扰最小,响应硬件架构和数据集特性的趋势。 预计通过分别降低防御性和生产性I/O成本来提高计算科学家工作负载的整体性能,空间和时间数据减少高达100倍和200倍,可能导致整体I/O成本提高高达50倍。 该项目利用多个合作,以建立系统协同设计和可扩展系统软件层的管理原则,以便在世界一流的计算基础设施中进行更好的数据编码。 该项目加强了马萨诸塞州洛厄尔大学的计算机工程课程,扩大了计算机工程的参与,并创建了一个合作的,跨学科的研究计划,旨在利用不断发展的计算范式。该奖项反映了NSF的法定使命,并已被认为是值得通过使用基金会的智力价值和更广泛的影响审查标准进行评估的支持。
项目成果
期刊论文数量(14)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Efficient Encoding and Reconstruction of HPC Datasets for Checkpoint/Restart
- DOI:10.1109/msst.2019.00-14
- 发表时间:2019-05
- 期刊:
- 影响因子:0
- 作者:Jialing Zhang;Xiaoyan Zhuo;Aekyeung Moon;Hang Liu;S. Son
- 通讯作者:Jialing Zhang;Xiaoyan Zhuo;Aekyeung Moon;Hang Liu;S. Son
Lossy Predictive Models for Accurate Classification Algorithms
精确分类算法的有损预测模型
- DOI:10.1109/bigdata55660.2022.10020381
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Moon, Aekyeung;Son, Seung Woo;Kim, Hyson;Kim, Minjun
- 通讯作者:Kim, Minjun
Evaluating fidelity of lossy compression on spatiotemporal data from an IoT enabled smart farm
- DOI:10.1016/j.compag.2018.08.045
- 发表时间:2018-11-01
- 期刊:
- 影响因子:8.3
- 作者:Moon, Aekyeung;Kim, Jaeyoung;Son, Seung Woo
- 通讯作者:Son, Seung Woo
Understanding Bit-Error Trade-off of Transform-based Lossy Compression on Electrocardiogram Signals
了解心电图信号基于变换的有损压缩的误码权衡
- DOI:10.1109/bigdata50022.2020.9378343
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Moon, Aekyeung;Woo Son, Seung;Jung, Jiuk;Jeong Song, Yun
- 通讯作者:Jeong Song, Yun
Anomaly Detection in Scientific Datasets using Sparse Representation
使用稀疏表示的科学数据集中的异常检测
- DOI:10.1145/3588982.3603610
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Moon, Aekyeung;Kim, Minjun;Chen, Jiaxi;Son, Seung Woo
- 通讯作者:Son, Seung Woo
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Seung Woo Son其他文献
Seung Woo Son的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Seung Woo Son', 18)}}的其他基金
OAC Core: Improving Data Integrity for HPC Datasets using Sparsity Profile
OAC 核心:使用稀疏性配置文件提高 HPC 数据集的数据完整性
- 批准号:
2312982 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
非平稳风下车-桥系统时变可靠度评估的高效随机振动方法研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
软实时多服务器系统高可靠高效益配置策略研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于主动学习代理模型的无砟轨道大跨度斜拉桥轨道实时平顺状态可靠性高效评估方法研究
- 批准号:52308223
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
高效能深度学习系统可靠性分析方法与容错策略研究
- 批准号:62302190
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
混凝土框架结构动力连续倒塌的能量判定准则与高效可靠度分析方法
- 批准号:52308197
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于重要失效边界高效采样与精确拟合方法的大型结构抗连续倒塌可靠度设计
- 批准号:52378126
- 批准年份:2023
- 资助金额:52 万元
- 项目类别:面上项目
分子通信中的信号高效传输与可靠检测技术研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
面向高效能小型化电源应用的氮化镓电力电子器件栅极可靠性研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
基于自适应代理模型的山区大跨桥梁风致列车运行安全可靠性高效评估
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
不确定性下结构条件可靠性分析高效方法及其应用研究
- 批准号:12272300
- 批准年份:2022
- 资助金额:55 万元
- 项目类别:面上项目
相似海外基金
CAREER: Efficient and Reliable Data Transfer Services for Next Generation Research Networks
职业:为下一代研究网络提供高效可靠的数据传输服务
- 批准号:
2348281 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Efficient and Reliable Data Transfer Services for Next Generation Research Networks
职业:为下一代研究网络提供高效可靠的数据传输服务
- 批准号:
2145742 - 财政年份:2022
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Efficient and Reliable Electronic Structure Theories for Spectroscopic Properties of Strongly Correlated Systems
职业:强相关系统光谱特性的高效可靠的电子结构理论
- 批准号:
2044648 - 财政年份:2021
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Probabilistic Network Flow Theory: Embracing Emerging Big Data for Efficient, Reliable and Sustainable Multi-modal Transportation Systems
职业:概率网络流理论:拥抱新兴大数据,打造高效、可靠和可持续的多式联运系统
- 批准号:
1751448 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Control, Optimization, and Market Design for Efficient and Reliable Integration of Renewable Energy Sources in Electric Power Systems
职业:电力系统中可再生能源高效可靠集成的控制、优化和市场设计
- 批准号:
1752362 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CAREER: Understanding and Combating Numerical Bugs for Reliable and Efficient Software Systems
职业:理解和对抗数字错误以实现可靠和高效的软件系统
- 批准号:
1750983 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Application-centric, Reliable and Efficient High Performance Computing
职业:以应用为中心、可靠且高效的高性能计算
- 批准号:
1553645 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Towards Reliable and Efficient Network Monitoring in White Space
职业:在白色空间实现可靠、高效的网络监控
- 批准号:
1502584 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Reliable and Fault Tolerant Super Energy Efficient Nanomagnetic Computing in the Presence of Thermal Noise
职业:存在热噪声时可靠且容错的超能效纳米磁计算
- 批准号:
1253370 - 财政年份:2013
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
CAREER: Towards Reliable and Efficient Network Monitoring in White Space
职业:在白色空间实现可靠、高效的网络监控
- 批准号:
1149500 - 财政年份:2012
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant