IRES Track-1: I/O Research for Data-Intensive Analytics and Deep Learning
IRES Track-1:数据密集型分析和深度学习的 I/O 研究
基本信息
- 批准号:1952302
- 负责人:
- 金额:$ 30万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2020
- 资助国家:美国
- 起止时间:2020-05-01 至 2025-04-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Applications of data science are becoming increasingly diverse. These applications include computation, input-output analysis, deep learning and several other fields. These diverse applications tend to generate and process their datasets in very different patterns. Their complex I/O patterns pose numerous challenges due to contention, congestion, and performance variabilities at multiple layers of the I/O stack including I/O middleware libraries, parallel file systems and storage devices. This IRES project aims to organize an international collaboration between Japan and the U.S. for research on I/O performance efficiency and data reliability for data-intensive analytics and deep learning applications. The IRES Track-1 site will be hosted at the Florida State University (FSU), through close collaboration with the RIKEN Center for Computational Science (R-CCS) in Kobe, Japan. As a world-renowned national lab, R-CCS has hosted the fastest K supercomputer in Japan and has been chosen as the site to host Japan’s future exascale computer, Fugaku. This project leverages such facilities for research and training of IRES participants and enriches the portfolio of international collaborations between the U.S. and Japan. Each year for the duration of the project, five (4 graduate and 1 undergraduate) U.S. students will be selected to participate in the IRES program to visit and do research at the R-CCS for 10 weeks. This project pursues cross-layer optimizations on I/O middleware libraries, parallel file systems, and storage configurations, serving data-intensive analytics and deep learning applications. The project consists of a number of research activities, including (1) I/O characterization of large-scale data-intensive applications and parallel file systems on large-scale supercomputers, (2) application-oriented I/O pipelining for deep learning applications and data reduction through compression; (3) user-level cross-layer optimizations of file and storage systems; and (4) development of multi-level checkpoint/restart with optimal checkpoint/restart intervals across hierarchical storage devices. The research can lead to many insights on how to develop efficient and reliable I/O techniques on high-performance computing (HPC) systems. The experience and lessons learned through this research can benefit the development of storage systems on leadership HPC systems for data analytics and deep learning applications and is expected to enhance the professional development of participating students.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
数据科学的应用正变得越来越多样化。这些应用包括计算、投入产出分析、深度学习等几个领域。这些不同的应用程序往往以非常不同的模式生成和处理它们的数据集。由于I/O堆栈的多个层(包括I/O中间件库、并行文件系统和存储设备)的争用、拥塞和性能差异,它们的复杂I/O模式带来了许多挑战。该IRES项目旨在组织日本和美国之间的国际合作,研究数据密集型分析和深度学习应用程序的I/O性能、效率和数据可靠性。IRES Track-1网站将通过与位于日本神户的理研计算科学中心(R-CCS)的密切合作,在佛罗里达州立大学(FSU)托管。作为世界知名的国家实验室,R-CCS拥有日本最快的K超级计算机,并被选为日本未来艾级计算机Fugaku的所在地。该项目利用这些设施对IRES参与者进行研究和培训,并丰富了美国和日本之间的国际合作组合。在该项目期间,每年将有5名美国学生(4名研究生和1名本科生)被选中参加IRES项目,他们将在R-CCS进行为期10周的访问和研究。该项目致力于I/O中间件库、并行文件系统和存储配置的跨层优化,为数据密集型分析和深度学习应用提供服务。该项目包括一些研究活动,包括(1)大规模数据密集型应用程序和大型超级计算机上的并行文件系统的I/O表征;(2)面向应用程序的I/O流水线,用于深度学习应用程序和通过压缩减少数据;(3)文件和存储系统的用户级跨层优化;以及(4)开发多级检查点/重启,在分层存储设备上具有最佳的检查点/重启间隔。这项研究可以为如何在高性能计算(HPC)系统上开发高效和可靠的I/O技术带来许多见解。通过这项研究获得的经验和教训可以帮助开发用于数据分析和深度学习应用程序的Leadance HPC系统上的存储系统,并有望促进参与学生的专业发展。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。
项目成果
期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
ROBOTune: High-Dimensional Configuration Tuning for Cluster-Based Data Analytics
- DOI:10.1145/3472456.3472518
- 发表时间:2021-08
- 期刊:
- 影响因子:0
- 作者:Md. Muhib Khan;Weikuan Yu
- 通讯作者:Md. Muhib Khan;Weikuan Yu
Accurate classification of depression through optimized machine learning models on high-dimensional noisy data
- DOI:10.1016/j.bspc.2021.103237
- 发表时间:2022-01
- 期刊:
- 影响因子:0
- 作者:Xingang Fang;Julia Klawohn;Alexander De Sabatino;Harsh Kundnani;Jon Ryan;Weikuan Yu;G. Hajcak
- 通讯作者:Xingang Fang;Julia Klawohn;Alexander De Sabatino;Harsh Kundnani;Jon Ryan;Weikuan Yu;G. Hajcak
O(1) Communication for Distributed SGD through Two-Level Gradient Averaging
- DOI:10.1109/cluster48925.2021.00054
- 发表时间:2020-06
- 期刊:
- 影响因子:0
- 作者:Subhadeep Bhattacharya;Weikuan Yu;Fahim Chowdhury
- 通讯作者:Subhadeep Bhattacharya;Weikuan Yu;Fahim Chowdhury
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Weikuan Yu其他文献
Performance Evaluation of FPGA-Based Biological Applications
基于 FPGA 的生物应用的性能评估
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
O. Storaasli;Weikuan Yu;D. Strenski;James Maltby - 通讯作者:
James Maltby
Ad Hoc File Systems for High-Performance Computing
用于高性能计算的临时文件系统
- DOI:
10.1007/s11390-020-9801-1 - 发表时间:
2020 - 期刊:
- 影响因子:1.9
- 作者:
A. Brinkmann;K. Mohror;Weikuan Yu;P. Carns;Toni Cortes;S. Klasky;Alberto Miranda;F. Pfreundt;R. Ross;Marc - 通讯作者:
Marc
JVM-Bypass for Efficient Hadoop Shuffling
用于高效 Hadoop Shuffle 的 JVM 旁路
- DOI:
10.1109/ipdps.2013.13 - 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
Yandong Wang;Cong Xu;Xiaobing Li;Weikuan Yu - 通讯作者:
Weikuan Yu
Performance evaluation and tuning of BioPig for genomic analysis
BioPig 用于基因组分析的性能评估和调整
- DOI:
10.1145/2831244.2831252 - 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Lizhen Shi;Zhong Wang;Weikuan Yu;Xiandong Meng - 通讯作者:
Xiandong Meng
Understanding I/O Behavior in Scientific Workflows on High Performance Computing Systems
了解高性能计算系统上科学工作流程中的 I/O 行为
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Fahim Chowdhury;Francesco Di;A. Moody;Elsa Gonsiorowski;K. Mohror;Weikuan Yu - 通讯作者:
Weikuan Yu
Weikuan Yu的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Weikuan Yu', 18)}}的其他基金
Collaborative Research: OAC Core: CropDL - Scheduling and Checkpoint/Restart Support for Deep Learning Applications on HPC Clusters
合作研究:OAC 核心:CropDL - HPC 集群上深度学习应用的调度和检查点/重启支持
- 批准号:
2403089 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
SaTC: CORE: Small: Realizing Enhanced Authentication in the Mobile Era
SaTC:核心:小:实现移动时代的增强认证
- 批准号:
2131143 - 财政年份:2021
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
SHF: Medium: Collaborative Research: ECC: Ephemeral Coherence Cohort for I/O Containerization and Disaggregation
SHF:媒介:协作研究:ECC:I/O 容器化和分解的临时一致性队列
- 批准号:
1763547 - 财政年份:2018
- 资助金额:
$ 30万 - 项目类别:
Continuing Grant
CRI: II-New: A Software Defined Infrastructure for Cross-Layer Research on Reconfigurable Architecture and Systems
CRI:II-New:用于可重构架构和系统跨层研究的软件定义基础设施
- 批准号:
1822737 - 财政年份:2018
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Eager: Collaborative Research: DiRecMR: Reconciling the Dichotomy of MapReduce for Efficient Speculation and Resilience
Eager:协作研究:DiRecMR:调和 MapReduce 的二分法以实现高效推测和弹性
- 批准号:
1744336 - 财政年份:2017
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CSR: Small: XooMR: Cross-Layer and Cross-Phase Cooperation for Fair and Efficient MapReduce
CSR:小:XooMR:跨层跨阶段合作实现公平高效的 MapReduce
- 批准号:
1564647 - 财政年份:2015
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
EAGER: Tadoop: A Dual-Purpose Framework Taming the Bipolarity of Storage and Communication for High-Performance Computing and Data Analytics
EAGER:Tadoop:一个双用途框架,克服存储和通信的两极性,实现高性能计算和数据分析
- 批准号:
1561041 - 财政年份:2015
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
EAGER: Tadoop: A Dual-Purpose Framework Taming the Bipolarity of Storage and Communication for High-Performance Computing and Data Analytics
EAGER:Tadoop:一个双用途框架,克服存储和通信的两极性,实现高性能计算和数据分析
- 批准号:
1432892 - 财政年份:2014
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
CSR: Small: XooMR: Cross-Layer and Cross-Phase Cooperation for Fair and Efficient MapReduce
CSR:小:XooMR:跨层跨阶段合作实现公平高效的 MapReduce
- 批准号:
1320016 - 财政年份:2013
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
II-New: A Compute and Storage Cluster for Multidisciplinary Research on Computer Systems and Scientific Simulations
II-New:用于计算机系统和科学模拟多学科研究的计算和存储集群
- 批准号:
1059376 - 财政年份:2011
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
相似国自然基金
面向轨道交通智能监测系统的低频能量收集技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
少样本条件下基于声发射的道岔区轨道
损伤识别研究
- 批准号:
- 批准年份:2025
- 资助金额:10.0 万元
- 项目类别:省市级项目
3D打印在轨道交通装备阀体绝缘件制造中的应用研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
轨道车辆智能维保机器人系统的开发与应用研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
拟声子晶体沥青混合料在轨道结构中的耦合减振机理与调控技术研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
轨道振动能量驱动的钢轨波磨自感知监测与演变规律研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
热-力耦合作用下CRTS II型板式无砟轨道层间损伤机理与稳定性研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
电动汽车无线供电交错双极型长轨道(ABLT)磁耦合机构特性及优化方法研究
- 批准号:2025JJ80397
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
发展非平衡多轨道FLEX+DMFT理论方法研究低维强关联电子系统
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
自旋轨道力矩驱动非共线反铁磁Mn3Sn磁矩翻转研究
- 批准号:
- 批准年份:2025
- 资助金额:0.0 万元
- 项目类别:省市级项目
相似海外基金
Collaborative Research: IRES Track I: Wireless Federated Fog Computing for Remote Industry 4.0 Applications
合作研究:IRES Track I:用于远程工业 4.0 应用的无线联合雾计算
- 批准号:
2417064 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: RUI: IRES Track I: From fundamental to applied soft matter: research experiences in Mexico
合作研究:RUI:IRES 第一轨:从基础到应用软物质:墨西哥的研究经验
- 批准号:
2426728 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
IRES Track I: Island Invasion Biology - Leveraging the Galapagos and Hawaiian Islands to provide immersive undergraduate research experiences.
IRES 轨道 I:岛屿入侵生物学 - 利用加拉帕戈斯群岛和夏威夷群岛提供沉浸式本科生研究体验。
- 批准号:
2245931 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
IRES Track I: US-Finnish research on sustainable evolution and technical debt management in cloud-native systems
IRES Track I:美国-芬兰关于云原生系统可持续发展和技术债务管理的研究
- 批准号:
2245287 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: RUI: IRES Track I: From fundamental to applied soft matter: research experiences in Mexico
合作研究:RUI:IRES 第一轨:从基础到应用软物质:墨西哥的研究经验
- 批准号:
2245405 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
IRES Track 1: International Research Experiences for Students: Phase II: Into the Magmatic Roots: Interactions Between Magmatism, Tectonics, and Sedimentation
IRES 轨道 1:学生国际研究经验:第二阶段:深入岩浆根源:岩浆作用、构造和沉积之间的相互作用
- 批准号:
2245854 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: IRES Track I: Artificial Intelligence and Human Designer - Research Experience in Singapore (AIHD Singapore)
合作研究:IRES 第一轨:人工智能和人类设计师 - 新加坡的研究经验 (AIHD Singapore)
- 批准号:
2246299 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: IRES Track I: US-Costa Rica Collaboration to Quantify the Holistic Benefits of Resource Recovery in Small-Scale Communities
合作研究:IRES 第一轨:美国-哥斯达黎加合作量化小规模社区资源回收的整体效益
- 批准号:
2246349 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
IRES Track I: US Student Research Experience in Design and Synthesis of Advanced Materials for High-efficiency Energy Storage and Conversion
IRES Track I:美国学生在高效能量存储和转换先进材料的设计和合成方面的研究经验
- 批准号:
2246336 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: IRES Track 1: Socio-ecological training in a tropical landscape
合作研究:IRES 第 1 轨道:热带景观中的社会生态培训
- 批准号:
2330189 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant