CCRI: ENS: Collaborative Research: Open Computer System Usage Repository and Analytics Engine
CCRI:ENS:协作研究:开放计算机系统使用存储库和分析引擎
基本信息
- 批准号:2016608
- 负责人:
- 金额:$ 49.99万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-10-01 至 2024-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In science and engineering research, large-scale, centrally managed computing clusters or “supercomputers” have been instrumental in enabling the kinds of resource-intensive simulations, analyses, and visualizations that have been used in computer-aided drug discovery, high strength materials design for cars and jet engines, and disease vector analysis to name a few. Such clusters are complex systems comprised of several hundred to thousand computer servers with fast network connections between them, various data storage resources, and highly optimized scientific software being shared with several hundred other researchers from diverse domains. Consequently, the overall dependability of such systems relies on the dependability of these individual highly interconnected elements as well as the characteristics of cascading failures. While computer systems researchers and practitioners have been at the forefront of designing and deploying dependable computing cluster systems, this task has been hampered by the lack of publicly available, real-world failure data from supercomputers currently in operation. Prior practice has largely involved tedious, manual collection and curation of small sets of data for use in specific analyses. This project will establish seamless, automated pipelines for acquiring, processing, and curating continuous, detailed system usage, monitoring, and failure data from large computing clusters at two organizations, Purdue University and the University of Texas at Austin. This data will be disseminated through a publicly accessible portal and complemented by a suite of in-situ analytics capabilities that will support and spur research in dependable computing systems. The data acquisition pipeline and analytics software will be made open-source and designed for ease of federation, extension, and adoption to cluster systems operated by other organizations.Cluster computing systems are a key resource in time-sensitive, computationally intensive research such as virus structure modeling and drug discovery and have been at the forefront of efforts to tackle global pandemics. Both unanticipated system down-times and lack of actionable feedback to researchers on computational failures can have adverse effects on research timeliness and efficiency. This project will allow the practitioners and administrators of these systems to develop data-backed best practices for ensuring high availability and utilization for their clusters. The resulting large, public data repository consisting of data from clusters with diverse workloads spanning traditional high-performance computing, modern accelerator-based computing (for example on graphics processing units (GPUs)), and cloud-style applications will allow the systems research community to consider forward-looking research questions based on real system data. The project will train a cadre of students in data analysis on live production systems and this will provide them with a unique learning experience, interfacing with a variety of stakeholders.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在科学和工程研究中,大规模、集中管理的计算集群或“超级计算机”在实现各种资源密集型模拟、分析和可视化方面发挥了重要作用,这些模拟、分析和可视化已用于计算机辅助药物发现、汽车和喷气发动机的高强度材料设计以及病媒分析等。这样的集群是由数百到数千台计算机服务器组成的复杂系统,这些服务器之间有快速的网络连接,各种数据存储资源,以及与来自不同领域的数百名其他研究人员共享的高度优化的科学软件。因此,此类系统的整体可靠性依赖于这些高度互连的单个元素的可靠性以及级联故障的特征。虽然计算机系统研究人员和从业人员一直处于设计和部署可靠的计算集群系统的前沿,但这项任务一直受到缺乏公开可用的、来自当前运行的超级计算机的真实故障数据的阻碍。先前的实践在很大程度上涉及繁琐的人工收集和管理用于特定分析的小数据集。该项目将建立无缝、自动化的管道,用于获取、处理和管理来自两个组织(普渡大学和德克萨斯大学奥斯汀分校)的大型计算集群的连续、详细的系统使用、监控和故障数据。这些数据将通过一个可公开访问的门户网站传播,并辅以一套现场分析能力,这将支持和促进可靠计算系统的研究。数据采集管道和分析软件将是开源的,并且设计为易于联合、扩展和采用由其他组织操作的集群系统。集群计算系统是时间敏感、计算密集型研究(如病毒结构建模和药物发现)的关键资源,并且一直处于应对全球流行病的前沿。意外的系统停机时间和对研究人员缺乏可操作的计算故障反馈都会对研究的及时性和效率产生不利影响。该项目将允许这些系统的从业者和管理员开发数据支持的最佳实践,以确保其集群的高可用性和利用率。由此产生的大型公共数据存储库由来自具有不同工作负载的集群的数据组成,这些数据跨越传统的高性能计算,现代基于加速器的计算(例如图形处理单元(gpu))和云风格的应用程序,将允许系统研究社区考虑基于真实系统数据的前瞻性研究问题。该项目将培训一批学生进行现场生产系统的数据分析,这将为他们提供独特的学习经验,与各种利益相关者进行交流。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Stephen Harrell其他文献
What is a "Meal"? Comparing Methods to Determine Cooking Events
什么是“餐”?
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Stephen Harrell;Theresa P. Beltramo;D. Levine;Garrick Blalock;A. Simons - 通讯作者:
A. Simons
Modeling the Product Life Cycle for Consumer Durables
耐用消费品的产品生命周期建模
- DOI:
- 发表时间:
1981 - 期刊:
- 影响因子:0
- 作者:
Stephen Harrell;E. Taylor - 通讯作者:
E. Taylor
A Guide to Optimizing Behavior Change in Fuel Efficient Stove Programs
优化节能炉灶行为改变的指南
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Stephen Harrell;C. Toombs;Johanna Young - 通讯作者:
Johanna Young
Stephen Harrell的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
相似国自然基金
基于色氨酸代谢调控ENS途径探讨电针治疗功能性消化不良的作用机制
- 批准号:JCZRLH202500075
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
基于GDNF/PI3K/AKT信号通路探讨白术七物颗粒调控ENS-ICC-SMC网络治 疗气阴两虚型STC的机制研究
- 批准号:2025JJ90111
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
水稻EnS150基因调控种子休眠和萌发的分子机制研究
- 批准号:32301853
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
岩藻糖基化修饰的MSCs介导GDNF正反馈调控肠神经元焦亡及ENPC自噬促进ENS重建
- 批准号:n/a
- 批准年份:2023
- 资助金额:0.0 万元
- 项目类别:省市级项目
生孢梭菌通过“IPA-AHR-mTOR”轴调控ENPC自噬参与糖尿病ENS重建的机制研究
- 批准号:82300616
- 批准年份:2023
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于肠道菌群/5-HT/ENS调控的番茄红素改善肠动力作用机制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
MSCs胞外囊泡调控ENPC的SETD2/H3K36轴在糖尿病ENS重建中的作用及机制研究
- 批准号:
- 批准年份:2021
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于lncRNA Ens6探讨天南星活性成分抑制线粒体分裂促进M2小胶质细胞极化改善缺血性脑卒中的作用机制研究
- 批准号:82003976
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
岩藻糖基化在MSCs介导的ENS重建中的作用及机制研究
- 批准号:81974068
- 批准年份:2019
- 资助金额:55.0 万元
- 项目类别:面上项目
从肌层巨噬细胞MM和ENS的Cross-talk 探讨广藿香活性成分对IBS-D肠神经稳态的调节机制
- 批准号:81973586
- 批准年份:2019
- 资助金额:55.0 万元
- 项目类别:面上项目
相似海外基金
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
- 批准号:
2235160 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
- 批准号:
2235157 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
- 批准号:
2235158 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
Collaborative Research: Research Infrastructure: CCRI: ENS: Enhanced Open Networked Airborne Computing Platform
合作研究:研究基础设施:CCRI:ENS:增强型开放网络机载计算平台
- 批准号:
2235159 - 财政年份:2023
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
Collaborative Research: CCRI: ENS: Boa 2.0: Enhancing Infrastructure for Studying Software and its Evolution at a Large Scale
合作研究:CCRI:ENS:Boa 2.0:增强大规模研究软件及其演化的基础设施
- 批准号:
2120448 - 财政年份:2021
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
Collaborative Research: CCRI: ENS: Boa 2.0: Enhancing Infrastructure for Studying Software and its Evolution at a Large Scale
合作研究:CCRI:ENS:Boa 2.0:增强大规模研究软件及其演化的基础设施
- 批准号:
2120386 - 财政年份:2021
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
Collaborative Research: CCRI: ENS: Boa 2.0: Enhancing Infrastructure for Studying Software and its Evolution at a Large Scale
合作研究:CCRI:ENS:Boa 2.0:增强大规模研究软件及其演化的基础设施
- 批准号:
2120345 - 财政年份:2021
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
CCRI: ENS: Collaborative Research: ns-3 Network Simulation for Next-Generation Wireless
CCRI:ENS:协作研究:下一代无线的 ns-3 网络仿真
- 批准号:
2016379 - 财政年份:2020
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
CCRI: ENS: Collaborative Research: ns-3 Network Simulation for Next-Generation Wireless
CCRI:ENS:协作研究:下一代无线的 ns-3 网络仿真
- 批准号:
2016381 - 财政年份:2020
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant
CCRI: ENS: Collaborative Research: Enabling Automated Language Support for the srcML Infrastructure
CCRI:ENS:协作研究:为 srcML 基础设施提供自动化语言支持
- 批准号:
2016452 - 财政年份:2020
- 资助金额:
$ 49.99万 - 项目类别:
Standard Grant














{{item.name}}会员




