分岐ペナルティを低減した高並列スーパスカラ・プロセッサ

高度并行的超标量处理器,减少分支惩罚

基本信息

  • 批准号:
    15700068
  • 负责人:
  • 金额:
    $ 2.37万
  • 依托单位:
  • 依托单位国家:
    日本
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
  • 财政年份:
    2003
  • 资助国家:
    日本
  • 起止时间:
    2003 至 2005
  • 项目状态:
    已结题

项目摘要

高い命令フェッチバンド幅を実現するキャッシュの構成方法として,実行終了した命令列を格納し再利用するトレースキャッシュによる命令フェッチ機構が提案されている.この方式はプログラム内の命令再利用率が高いプログラムにおいて高い性能を発揮する.しかし,この方式では命令データを格納するために実行履歴を格納するトレースキャッシュと,メモリからの命令データを格納する命令キャッシュという2つの異なるキャッシュが必要となる.この2つのキャッシュ容量はプログラムの実行過程やワーキングセットによって必要となる容量が変化する.この変化に追従するために従来2つ必要であったキャッシュを1つに統合し,動的にキャッシュ容量を変化させることが可能な統合型トレースキャッシュを提案しており,キャッシュの命令フェッチ数をベンチマークプログラムSPECint95のgccにおいて,最大13%,平均5%向上することに成功している.しかし,提案キャッシュを実装した場合,プロセッサ全体のパイプラインレイテンシによって大きくなる分岐予測ミスペナルティによって得られた性能向上が隠蔽される.そこで本研究では,キャッシュの性能を十分に活かすためにRyan Rakvicらの提案するマルチ分岐予測器であるTMP(Tree Based Multiple Branch Predictor)を導入することでIPCを最大で4.9%,平均で2.4%向上することができた.さらに,スーパスカラプロセッサの分岐予測ミスペナルティを大きくする原因であるレイテンシ削減のため,動作周波数を低下させずにパイプラインステージ数を削減できる実行ステージ構成やレジスタファイルに関する検討を行い,バンク化によるレジスタファイルサイズの大幅削減を実現すると共に動作周波数を低下させることなく,パイプラインステージを1ステージ削減できる事を部分的な詳細設計により確認した.
High い command フ ェ ッ チ バ ン ド を picture be presently す る キ ャ ッ シ ュ の composition method と し て, be the end of line し た command column を Wagner し reuse す る ト レ ー ス キ ャ ッ シ ュ に よ る command フ ェ ッ チ institutions が proposal さ れ て い る. こ の way は プ ロ グ ラ ム の within high command again utilization が い プ ロ グ ラ ム に お い て い high performance を 発 swing す る. し か し, こ の way で は command デ ー タ を Wagner す る た め に line be shoe bearing を Wagner す る ト レ ー ス キ ャ ッ シ ュ と, メ モ リ か ら の command デ ー タ を Wagner す る command キ ャ ッ シ ュ と い う 2 つ の different な る キ ャ ッ シ ュ が necessary と な る. こ の 2 つ の キ ャ ッ シ ュ capacity は プ ロ グ ラ ム の be line process や ワ ー キ ン グ セ ッ ト に よ っ が て necessary と な る capacity - the す る. こ の variations change に chase 従 す る た め に 従 to 2 つ で necessary あ っ た キ ャ ッ シ ュ を 1 つ integration に し, moving に キ ャ ッ シ を ュ capacity - the さ せ る こ と が may な integrate type ト レ ー ス キ ャ ッ シ ュ を proposal し て お り, キ ャ ッ シ ュ の command フ ェ ッ チ number を ベ ン チ マ ー ク プ ロ グ ラ ム SPEC Int95 の GCC に お い て, maximum 13%, on average, 5% up す る こ と に successful し て い る. し か し, proposal キ ャ ッ シ ュ を be loaded し た occasions, プ ロ セ ッ サ all の パ イ プ ラ イ ン レ イ テ ン シ に よ っ て big き く な る gaps can be ミ ス ペ ナ ル テ ィ に よ っ て have ら れ た government performance が up all さ れ る. そ こ で in this research Investigate で は, キ ャ ッ シ ュ の performance を live very に か す た め に Ryan Rakvic ら の proposal す る マ ル チ gaps to sensor で あ る TMP (Tree -based Multiple Branch Predictor) を import す る こ と で IPC を biggest で 4.9%, average 2.4% で す upward る こ と が で き た. さ ら に, ス ー パ ス カ ラ プ ロ セ ッ サ の gaps can be ミ ス ペ ナ ル テ ィ を big き く す る reason で あ る レ イ テ ン シ cut の た め, action cycle for low を さ せ ず に パ イ プ ラ イ ン ス テ ー ジ number を cut で き る line be ス テ ー ジ constitute や レ ジ ス タ フ ァ イ ル に masato す る 検 for line を い, バ ン ク change に よ る レ ジ ス タ フ ァ イ ル サ イ ズ の slash を be presently す る と に action cycle for total low を さ せ る こ と な く, パ イ プ ラ イ ン ス テ ー ジ を 1 ス テ ー ジ cut で き る matter を part of detailed design に な よ り confirm し た.

项目成果

期刊论文数量(4)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Superscalar Processor with Multi-Bank Register File
具有多组寄存器文件的超标量处理器
平川泰: "非数値演算を効率良く実行する統合型トレースキャッシュの評価"情報処理学会研究報告2003-ARC-155. Vol.2003,No.119. 39-44 (2003)
Yasushi Hirakawa:“有效执行非数字操作的集成跟踪缓存的评估”日本信息处理协会研究报告 2003-ARC-155,第 119 卷(2003 年)。
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
  • 通讯作者:
統合型トレースキャッシュにおける分岐予測器のシミュレーション評価
集成跟踪缓存中分支预测器的仿真评估
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Tetsuo Hironaka;谷川一哉
  • 通讯作者:
    谷川一哉
統合型トレースキャッシュ向け分岐予測器の検討
考虑集成跟踪缓存的分支预测器
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

弘中 哲夫其他文献

幅優先探索専用のアクセラレータを対象としたアーキテクチャ探索のためのシミュレータ開発
开发专用于广度优先搜索的加速器架构搜索模拟器
末尾再帰でない再帰プログラムの高速 化のための最適化に関する一考察
非尾递归递归程序加速优化研究
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    小林 周太郎;川端 英之;弘中 哲夫
  • 通讯作者:
    弘中 哲夫
Haskellにおける型クラス制約を満足する型変数割当ての唯一性検査に基づく型の曖昧性解決
基于满足 Haskell 中类型类约束的类型变量赋值的唯一性检查的类型歧义解决
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    河野 雄也;川端 英之;弘中 哲夫
  • 通讯作者:
    弘中 哲夫
再構成可能デバイスMPLD/SePLDにおける設計アルゴリズムについて
关于可重构器件 MPLD/SePLD 的设计算法
  • DOI:
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    谷川 一哉 ;弘中 哲夫
  • 通讯作者:
    弘中 哲夫

弘中 哲夫的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('弘中 哲夫', 18)}}的其他基金

演算器構成を毎サイクル再構成可能なマイクロプロセッサの研究
每周期可重构运算单元结构微处理器的研究
  • 批准号:
    12780238
  • 财政年份:
    2000
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
大規模マルチプロセッサ向き共有メモリ・アーキテクチャの研究
大规模多处理器共享内存体系结构研究
  • 批准号:
    08780304
  • 财政年份:
    1996
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
プロセッサ・アーキテクチャおよびオブジェクト・コード評価用ワークベンチの研究
处理器架构和目标代码评估工作台研究
  • 批准号:
    07780284
  • 财政年份:
    1995
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
対話型操作によりオブジェクト・プログラムを最適化する手法の研究
通过交互操作优化目标程序的方法研究
  • 批准号:
    06780271
  • 财政年份:
    1994
  • 资助金额:
    $ 2.37万
  • 项目类别:
    Grant-in-Aid for Encouragement of Young Scientists (A)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了