空間冗長度の時間畳み込みによるクラスタシステムの高信頼化
通过空间冗余的时间卷积提高集群系统的可靠性
基本信息
- 批准号:16650008
- 负责人:
- 金额:$ 2.24万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Exploratory Research
- 财政年份:2004
- 资助国家:日本
- 起止时间:2004 至 2005
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
本研究の目的は、汎用の高性能な計算ノードを多数高速ネットワークで接続するクラスタシステムの高信頼化であり、クラスタシステムの状態を最低限の空間冗長度で保持し、それを時間軸上で畳み込むことでさらに高い冗長度を確保する新しい手法として、skewed checkpointingという新しいチェックポイント方式を提案した。本年度はまず、前年度開発したチェックポイント方式のシミュレータを開発した。これにより、CPU/network/disk等の実システムの性能、および故障率に応じて、アルゴリズムの最適化を実施した場合の効果を検証することが可能となる。その後、提案するチェックポイント方式を実際のクラスタ上にプロトタイプ実装し、状態保存に要する時間、状態復元に要する時間を測定した。提案手法の有効性は、シミュレーションを用いて示すべきだが、そもそも故障は確率的に発生するものなので、結果の精度を上げるためには膨大なシミュレーションをする必要がある。特に、多重故障などの発生確率の低い障害に対する効果を示すことはシミュレーションでは難しい。そこで、マルコフモデルを用いて、性能と信頼性の両方を含むperformabilityの理論解析も実施した。シミュレーション評価から、CPU/network/disk等の実システムの性能、および故障率に応じて最適化する提案チェックポイント方式の有効性が明らかになり、また、この結果が理論解析結果とほぼ一致したことからその検証も行えた。この結果を踏まえ、実行中に故障率が変動する場合に動的にチェックポイント方式を最適化する手法に関しても提案し、シミュレーション評価により、その有効性を示すことができた。故障率が変動する場合の理論解析はまだ不十分であるが、実行中に故障率が変動するという、実環境に即した仮定を考慮することができたのは意義深い成果である。
The purpose of this study is to propose a new method for ensuring high redundancy on the Timeline, while maintaining minimum spatial redundancy in the state of most high-speed computing applications. This year, compared with the previous year, the development of new technology and new technologies was launched. The performance, failure rate, and optimization of the system, CPU/network/disk, etc., can be verified. The time required for state preservation and state recovery is measured during the process of setting up the system and the method of setting up the system. The proposed method has the following characteristics: In particular, multiple failures are difficult to achieve due to low probability of failure. A theoretical analysis of the performance of the system. The performance, failure rate and optimization of CPU/network/disk implementation system are discussed. The results of theoretical analysis are consistent. The result is that when the failure rate changes, the method of optimization is proposed, the failure rate changes, and the performance changes. The theoretical analysis of the fault rate is not very good. The fault rate is very good. The environment is very stable. The fault rate is very important.
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
空間的・時間的な故障率の変動を考慮したチェックポインティング手法の初期検討
考虑故障率时空波动的检查点方法初步研究
- DOI:
- 发表时间:2005
- 期刊:
- 影响因子:0
- 作者:東美和子;近藤正章;今井雅;中村宏;南谷崇
- 通讯作者:南谷崇
多重故障を考慮した計算機クラスタ向けSkewed Checkpointingの検討
考虑多重故障的计算机集群倾斜检查点研究
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:田島裕也;林田卓朗;近藤正章;今井雅;中村宏;南谷崇
- 通讯作者:南谷崇
Skewed Checkpointing for Tolerating Multi-Node Failures
用于容忍多节点故障的倾斜检查点
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:H.Nakamura;T.Hayashida;M.Kondo;Y.Tajima;M.Imai;T.Nanya
- 通讯作者:T.Nanya
多重故障に適応したSkewed Checkpointingの提案
适应多种故障的倾斜检查点提案
- DOI:
- 发表时间:2004
- 期刊:
- 影响因子:0
- 作者:田島裕也;林田卓朗;近藤正章;今井雅;中村宏;南谷崇
- 通讯作者:南谷崇
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
中村 宏其他文献
キャッシュ電源遮断時の性能ペナルティ削減のための損失データプリフェッチ
丢失数据预取以减少缓存断电时的性能损失
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
有間 英志;薦田 登志矢;中田 尚;三輪 忍;中村 宏 - 通讯作者:
中村 宏
CMPにおけるリソース競合に着目した性能の解析とモデリング
侧重于 CMP 中资源争用的性能分析和建模
- DOI:
- 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
佐々木 広;近藤 正章;中村 宏 - 通讯作者:
中村 宏
中村 宏的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('中村 宏', 18)}}的其他基金
トラフィックの時空間特徴量に着目したDoS耐性IoTアーキテクチャの研究
关注流量时空特征的抗DoS物联网架构研究
- 批准号:
23K28051 - 财政年份:2024
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
トラフィックの時空間特徴量に着目したDoS耐性IoTアーキテクチャの研究
关注流量时空特征的抗DoS物联网架构研究
- 批准号:
23H03361 - 财政年份:2023
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Formulation of Teaching Methods and Development of Teaching Materials for Nursing Education in Online Education
在线教育中护理教育教学方法的制定及教材的开发
- 批准号:
21K10587 - 财政年份:2021
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
故障率の変動を考慮した空間冗長度の時間畳み込みによるクラスタシステムの高信頼化
考虑故障率波动的空间冗余的时间卷积提高集群系统的可靠性
- 批准号:
18650010 - 财政年份:2006
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Exploratory Research
脊髄損傷時の不可逆的神経変性を治癒過程に導くアポトーシス抑制療法の解明
阐明抗凋亡疗法可引导脊髓损伤过程中不可逆的神经变性至愈合过程
- 批准号:
11770792 - 财政年份:1999
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
悪性腫瘍増殖に及ぼす体外循環の影響に関する実験的研究
体外循环对恶性肿瘤生长影响的实验研究
- 批准号:
10770667 - 财政年份:1998
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
大規模科学技術計算を指向したプロセッサアーキテクチャの研究
大规模科学技术计算的处理器架构研究
- 批准号:
07780222 - 财政年份:1995
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
大規模科学技術計算に適したプロセッサの処理方式に関する研究
适合大规模科学技术计算的处理器处理方法研究
- 批准号:
06780228 - 财政年份:1994
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
レイアウト情報を用いた高性能プロセッサの方式レベル設計支援システムの開発
使用布局信息开发高性能处理器的方法级设计支持系统
- 批准号:
05780224 - 财政年份:1993
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
高性能コンピュータ設計を支援する方式レベル検証系の開発
开发方法级验证系统以支持高性能计算机设计
- 批准号:
04750302 - 财政年份:1992
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
低消費エネルギ型銅-スズTLP接合部の経時変化構成モデリングによる高信頼化
通过低能量铜锡 TLP 结的时间相关配置建模提高可靠性
- 批准号:
24K07211 - 财政年份:2024
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
空間分割技術を軸とした多元接続型海中ワイヤレス給電通信の高信頼化技術に関する研究
以空分技术为核心的多连接水下无线输电通信高可靠性技术研究
- 批准号:
24K07486 - 财政年份:2024
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
装着型脳磁図計測・解析の高信頼化技術開発
开发高可靠的可穿戴脑磁图测量和分析技术
- 批准号:
24K10473 - 财政年份:2024
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
パワエレ機器の絶縁高信頼化に向けた革新的機能性電界緩和材料技術
创新功能电场缓和材料技术,提高电力电子设备绝缘可靠性
- 批准号:
24K17257 - 财政年份:2024
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Single-Molecule High-Confidence Detection of miRNA Cancer Biomarkers
miRNA 癌症生物标志物的单分子高置信度检测
- 批准号:
10612611 - 财政年份:2023
- 资助金额:
$ 2.24万 - 项目类别:
バイポーラデバイスの高信頼化に向けた炭化ケイ素結晶中の積層欠陥挙動に関する研究
碳化硅晶体堆垛层错行为研究,提高双极器件的可靠性
- 批准号:
22J21606 - 财政年份:2022
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for JSPS Fellows
高信頼化に向けたメムキャパシタ脳型コンピュータ設計基盤
Memcapacitor脑型计算机设计平台,可靠性高
- 批准号:
22K11954 - 财政年份:2022
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
機械学習システムを高信頼化するNバージョン構成手法の研究
使机器学习系统高可靠的N版本配置方法研究
- 批准号:
22K17871 - 财政年份:2022
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
間欠動作する故障検出機構と多重化によるAMSシステムの高信頼化
通过间歇性故障检测机制和多路复用提高 AMS 系统的可靠性
- 批准号:
21K11813 - 财政年份:2021
- 资助金额:
$ 2.24万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Safety and Security Assurance for Engineering High Confidence Software in Information Systems
信息系统高可信软件工程的安全保障
- 批准号:
RGPIN-2014-06499 - 财政年份:2021
- 资助金额:
$ 2.24万 - 项目类别:
Discovery Grants Program - Individual