SHF: Small: Directoryless Shared Memory Using Execution Migration
SHF:小型:使用执行迁移的无目录共享内存
基本信息
- 批准号:1116372
- 负责人:
- 金额:$ 40万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-09-01 至 2015-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The increase in processor clock frequencies from 1980-2003 has slowed down significantly in recent years. To improve computer performance computer architects are exploring parallel architectures including many-core architectures. In a many-core or multi-core architecture, processor cores with relatively low complexity are connected to memory and to each other via high-bandwidth on-chip interconnect. The most popular programming model for multi-cores is that of shared memory. In this memory model, programmers write different threads that can run on different processors all of which can share a single memory space. This means that the on-chip cache memory on the multi-core chip should behave like a large shared cache. Unfortunately, current schemes for cache coherence either suffer from lack of scalability or require large directories at each core significantly increasing chip area and power. A directoryless cache coherence scheme is being investigated in this project that relies on the mechanism of execution migration. In execution migration, a thread?s context or state moves to the processor in whose cache the data resides. An important advantage of an execution migration architecture is that only a one-way trip is required to access data, since the thread moves to access data. In conventional data migration architectures, a round-trip is required to access data ? a request is sent to the location where the data resides and then the data is sent to the requesting thread. Further, only one copy of data need be present on chip if execution migration is used, since threads can move. This means that cache coherence is trivially ensured. Moreover, the chip can store more distinct data, since data is not replicated and this reduces off-chip access rates. Finally, an execution migration architecture can exploit the plentiful on-chip bandwidth available to speed up thread migration, thereby reducing data access latency.There are challenges associated with this architecture corresponding to contention for shared data across multiple threads, and the energy required to move thread contexts. The first challenge is being met through judicious replication of data at the program source level or compiler level. In particular, limited read copies of data are created across multiple threads. Since these copies only exist in between two writes to the data, coherence is ensured as before without need for complex coherence logic. However, contention for shared data is significantly reduced. The second challenge of energy consumption is being met through migration of partial thread contexts ? if a stack machine is used as the processor core, energy consumption can be reduced by migrating a subset of the thread context corresponding to the top part of the stack instead of the entire stack.In this project, an Execution Migration Machine with over 100 cores is being designed, and being evaluated using cycle-accurate simulation, and critical elements of the machine are being built on a Field Programmable Gate Array (FPGA). This project has the potential to meet the scalability and programmability challenges that face shared memory multi-core architectures. The Execution Migration Machine design will shed insight into how best thread migration can be used to enhance multi-core performance, possibly in combination with data migration. If successful, the project will impact the design of future multi-core processors through intelligent use of program and data migration.
1980-2003年间处理器时钟频率的增长在最近几年已显著放缓。为了提高计算机性能,计算机架构师正在探索并行体系结构,包括多核体系结构。在多核或多核体系结构中,具有相对较低复杂性的处理器核通过高带宽片上互连连接到存储器并相互连接。最流行的多核编程模型是共享内存模型。在这种内存模型中,程序员编写不同的线程,这些线程可以在不同的处理器上运行,所有这些处理器都可以共享一个内存空间。这意味着多核芯片上的片上高速缓存应该像大型共享高速缓存一样运行。遗憾的是,当前用于高速缓存一致性的方案要么缺乏可伸缩性,要么需要在每个核心处使用大目录,从而显著增加了芯片面积和功率。本项目正在研究一种依赖于执行迁移机制的无目录高速缓存一致性方案。在执行迁移中,线程--S上下文或状态--移动到数据驻留在其缓存中的处理器。执行迁移体系结构的一个重要优势是只需要单向访问数据,因为线程会移动来访问数据。在传统的数据迁移体系结构中,需要往返访问数据?请求被发送到数据驻留的位置,然后数据被发送到请求线程。此外,如果使用执行迁移,则只需要在芯片上存在数据的一个副本,因为线程可以移动。这意味着高速缓存一致性得到了微不足道的保证。此外,芯片可以存储更多不同的数据,因为数据不被复制,这降低了芯片外的访问率。最后,执行迁移体系结构可以利用丰富的片上带宽来加速线程迁移,从而减少数据访问延迟。与该体系结构相关联的挑战对应于跨多个线程的共享数据的争用以及移动线程上下文所需的能量。第一个挑战是通过在程序源代码级别或编译器级别明智地复制数据来应对。特别是,跨多个线程创建有限的数据读取副本。由于这些副本仅存在于对数据的两次写入之间,因此可以像以前一样确保一致性,而不需要复杂的一致性逻辑。然而,对共享数据的争用显著减少。能源消耗的第二个挑战是通过迁移部分线程上下文来解决吗?在本项目中,正在设计一台拥有100多个核心的执行迁移机,并使用精确的周期模拟对其进行评估,并且将机器的关键部件构建在现场可编程门阵列(FPGA)上。该项目具有满足共享内存多核架构所面临的可扩展性和可编程性挑战的潜力。执行迁移机器的设计将深入了解如何使用最好的线程迁移来增强多核性能,并可能与数据迁移结合使用。如果成功,该项目将通过智能使用程序和数据迁移来影响未来多核处理器的设计。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Srini Devadas其他文献
Self-aware computing in the Angstrom processor
Angstrom 处理器中的自我感知计算
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Henry Hoffmann;Jim Holt;George Kurian;Eric Lau;Martina Maggio;Jason E. Miller;Sabrina M. Neuman;Mahmut E. Sinangil;Yildiz Sinangil;A. Agarwal;A. Chandrakasan;Srini Devadas - 通讯作者:
Srini Devadas
Hardware Mechanisms for Memory Authentication
内存验证的硬件机制
- DOI:
- 发表时间:
2003 - 期刊:
- 影响因子:0
- 作者:
Edward Suh;Dwaine E. Clarke;B. Gassend;Marten Van Dijk;Srini Devadas;G. Suh;Srini Devadas - 通讯作者:
Srini Devadas
Srini Devadas的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Srini Devadas', 18)}}的其他基金
SaTC: CORE: Medium: Provably Secure, Usable, and Performant Enclaves in Multicore Processors
SaTC:CORE:中:多核处理器中可证明安全、可用且高性能的 Enclave
- 批准号:
2115587 - 财政年份:2021
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
SaTC: CORE: Medium: Collaborative: Hardening Off-the-Shelf Software Against Side Channel Attacks
SaTC:核心:媒介:协作:强化现成软件以抵御侧通道攻击
- 批准号:
1955270 - 财政年份:2020
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
SaTC: CORE: Small: Design of Efficient, Horizontally-Scaling, and Strongly Anonymous Communication Networks
SaTC:核心:小型:高效、水平扩展和强匿名通信网络的设计
- 批准号:
1813087 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
SPX: Collaborative Research: Distributed Database Management with Logical Leases and Hardware Transactional Memory
SPX:协作研究:具有逻辑租赁和硬件事务内存的分布式数据库管理
- 批准号:
1822920 - 财政年份:2018
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
STARSS: Small: Trapdoor Computational Fuzzy Extractors
STARSS:小型:活板门计算模糊提取器
- 批准号:
1523572 - 财政年份:2015
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
TWC: TTP Option: Frontier: Collaborative: MACS: A Modular Approach to Cloud Security
TWC:TTP 选项:前沿:协作:MACS:云安全的模块化方法
- 批准号:
1413920 - 财政年份:2014
- 资助金额:
$ 40万 - 项目类别:
Continuing Grant
XPS: FULL: DSD: Collaborative Research: Moving the Abyss: Database Management on Future 1000-core Processors
XPS:完整:DSD:协作研究:移动深渊:未来 1000 核处理器上的数据库管理
- 批准号:
1438967 - 财政年份:2014
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
TWC: Small: Ascend: Architecture for Secure Computation on Encrypted Data
TWC:小型:Ascend:加密数据安全计算架构
- 批准号:
1317763 - 财政年份:2013
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
EAGER: Collaborative: Holistic Security for Cloud Computing: Oblivious Computation
EAGER:协作:云计算的整体安全性:不经意的计算
- 批准号:
1347279 - 财政年份:2013
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
SHF: Medium: Collaborative Research: Throughput-Driven Multi-Core Architecture and a Compilation System
SHF:中:协作研究:吞吐量驱动的多核架构和编译系统
- 批准号:
0904598 - 财政年份:2009
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
- 批准号:
10099896 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
- 批准号:
AH/X011747/1 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
- 批准号:
MR/Z503757/1 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
- 批准号:
BB/Y004426/1 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
- 批准号:
ST/Z000017/1 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
- 批准号:
2312089 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
- 批准号:
2317251 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
- 批准号:
2329908 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
- 批准号:
2331111 - 财政年份:2024
- 资助金额:
$ 40万 - 项目类别:
Standard Grant