云环境中支持混合并行模式的科学工作流的执行优化

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61462076
  • 项目类别:
    地区科学基金项目
  • 资助金额:
    44.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0204.计算机系统结构与硬件技术
  • 结题年份:
    2018
  • 批准年份:
    2014
  • 项目状态:
    已结题
  • 起止时间:
    2015-01-01 至2018-12-31

项目摘要

Scientific workflows can improve the automation of scientific processes with the capabilities of the integration, construction and coordination of heterogeneous distributed data, services and tools. Tasks in a scientific workflow may be either data-intensive or computation-intensive in many domains nowadays. Thus, scientific workflows using the cloud as their computation environment often mix multiple parallelization patterns. The proposal explores key approaches and theories to enable the optimization of the execution of scientific workflows. The proposed approaches and theories can improve the execution efficiency and reduce the financial cost of scientific workflows with mixed parallelization patterns in cloud. Contributions include: (1)A data caching policy is proposed based on the concept and approaches that can realize efficient task data sharing through the optimization of data splitting. (2)Approaches to the construction of the workflow execution plans and the estimation of the virtual machine amount and types are proposed, which can be adaptive to the dynamic cloud environment, especially to the dynamic charging policies in cloud. The approaches can also improve the utility of virtual machine resources. (3)An approach to the execution optimization of scientific workflows with mixed parallelization patterns is proposed, which can balance workloads of virtual clusters and instances shared by tasks or sub-workflows with various parallelization patterns, and dynamically scale virtual machine resources based on the measures that can permit a workflow task to violate its local constraints with a certain probability.
科学工作流可集成、构造和协同分布异构的数据、服务和软件,其任务可同时属于数据和计算密集型,促使其选择云作为计算环境,并支持混合并行模式。针对云环境中支持混合并行模式的科学工作流,本申请以提高其执行效率,降低执行费用为目标,研究其执行优化涉及的关键问题。(1)提出一种数据并行任务的输入数据的分片方法,以提高多版本的工作流任务数据及其分片的复用率,并提出工作流任务的多版本数据集在云中的优化缓存策略。(2)建立适应云环境动态计价模式的工作流执行计划的生成方法和所需虚拟机的数量和类型的求解方法,以提高虚拟机资源的利用率,并形成科学工作流执行计划的评价理论。(3)提出混合并行模式科学工作流的动态优化方法,可实现多种并行模式的任务及工作流片段共享虚拟机集群及实例时的负载均衡,并通过允许任务弹性服从局部约束的策略以及当任务以一定概率违反该约束时的调整原则,支持虚拟机资源的动态伸缩,以保持资源的高利用率。

结项摘要

面向混合并行科学工作流,以提高其在云环境下的执行效率、降低执行费用、提高资源的利用率,研究了:(1)任务数据集的缓存和复用策略。首先,发现了科学工作流执行环境中,影响应用执行性能的关键因素及其相互关系,发现当数据量越大时,节点数越多应用执行的效率较高;但当数据量一定时,并非节点数越多,应用的执行效率越高;而当任务数接近节点数时,应用的执行效率较高。其次,通过研究科学工作流的数据副本的放置策略,提出了基于数据依赖度,兼顾传输时间开销的数据布局策略以及增量数据敏感的低成本数据放置方法,可有效的降低数据的传输次数和总量,复用中间数据,降低科学工作流的运行时间开销和运行成本。另外,提出了一种基于区块链的科学工作流的Provenance共享框架,可支持工作流片段在虚拟科学社区中的可靠和高效共享,通过避免不必要的任务重复执行,节约工作流的执行成本,并可用于验证科学工作流对应的试验的可重复性。(2)科学工作流的执行计划生成方法。从提高执行效率、降低成本、估算处理机资源数量和类型等不同的角度,分别提出了基于层间优化、允许违法局部约束、基于松弛时间优化、基于装箱理论的四种科学工作流执行计划生成和优化方法。(3)科学工作流的动态执行优化方法。为实现负载均衡,提高虚拟机资源的利用率,提出了基于马尔科夫过程模型的动态优化方法。另外,考虑到科学工作流的任务可能同时兼具数据密集和计算密集的特点,引入了一个真实的大数据环境下BP神经网络的数据分布并行训练案例,探讨了MapReduce和Spark工作流的应用及其优化方法,提出了基于局部权阵进化的BP神经网络MapReduce训练方法,能够极大地提高训练效率。该方法在精准扶贫及普惠金融的实际问题中得到了应用推广。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(1)
会议论文数量(2)
专利数量(3)
基于Storm的AQI实时预测模型
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程与设计
  • 影响因子:
    --
  • 作者:
    刘洪通;冯百明;温向慧;车翔飞
  • 通讯作者:
    车翔飞
云环境下影响数据分布并行应用执行效率的因素分析
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机应用
  • 影响因子:
    --
  • 作者:
    马生俊;陈旺虎;俞茂义;李金溶;郏文博
  • 通讯作者:
    郏文博
Hadoop集群中影响应用性能的因素分析
  • DOI:
    --
  • 发表时间:
    2018
  • 期刊:
    小型微型计算机系统
  • 影响因子:
    --
  • 作者:
    马生俊;陈旺虎
  • 通讯作者:
    陈旺虎
基于OpenCL的并行kNN算法设计与实现
  • DOI:
    --
  • 发表时间:
    2017
  • 期刊:
    计算机工程与科学
  • 影响因子:
    --
  • 作者:
    杨朋霖;冯百明;周志阳;温向慧
  • 通讯作者:
    温向慧
基于局部收敛权阵进化的BP神经网络MapReduce训练
  • DOI:
    --
  • 发表时间:
    2016
  • 期刊:
    计算机工程与科学
  • 影响因子:
    --
  • 作者:
    陈旺虎;俞茂义;马生俊;李金溶;郏文博
  • 通讯作者:
    郏文博

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

一种面向任务型无线传感网络的拓扑控制方法
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程
  • 影响因子:
    --
  • 作者:
    陈争宝;陈旺虎
  • 通讯作者:
    陈旺虎
虚拟组织的资源查询机制研究
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    电脑知识与技术
  • 影响因子:
    --
  • 作者:
    赵凯;冯百明;陈旺虎;ZHAO Kai;FENG Bai-ming;CHEN Wang-hu
  • 通讯作者:
    CHEN Wang-hu
一种面向领域、可定制的服务模型
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机工程,已录用(EI收录)
  • 影响因子:
    --
  • 作者:
    王建武*;陈旺虎;韩燕波
  • 通讯作者:
    韩燕波

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码