多数据中心环境中科学大数据应用的数据布局与执行优化研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61502097
  • 项目类别:
    青年科学基金项目
  • 资助金额:
    21.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0207.计算机网络
  • 结题年份:
    2018
  • 批准年份:
    2015
  • 项目状态:
    已结题
  • 起止时间:
    2016-01-01 至2018-12-31

项目摘要

Small or middle-sized Data Center (DC) in scientific experiments usually has limits in its computing, storage and networking capability. Such limits often cause the inefficient execution of scientific big data application in multi-datacenter environment. This project thus proposes to optimize three key components that impact the overall execution efficiency of scientific big data application: data placement, task assignment and job scheduling. Firstly, a request-pattern aware data placement algorithm is proposed with a joint consideration of the storage limit of each data center. It is able to significantly reduce the data access cost for those request patterns spanning multiple DCs. Secondly, a task assignment algorithm driven by the data placement objective is proposed. This algorithm accounts for the heterogeneity of time-varying computing capability available in each DC. By considering the trade-off between each DC’s computing and inter-DC’s networking capabilities, this algorithm can largely reduce the overall completion time for those batch computing tasks. Thirdly, a job scheduling algorithm that accounts for the storage and computing capability limits of each DC is proposed. This algorithm realizes the optimization of inter-DC data transfer by a joint consideration of the location of job’s input data in multiple DCs and the data dependencies between adjacent tasks of the candidate job. In summary, this project enacts a practical solution for the efficient execution of scientific big data application in multi-DC environment by the optimization of data distribution and job execution.
针对多数据中心存储、计算、网络等方面的资源限制引发的科学大数据应用分布式运行效率低下问题,本项目围绕多数据中心环境中科学大数据应用的数据布局和执行优化研究,拟从数据放置、任务指派和作业调度三个方面分别展开优化研究,分别重点解决其中的合理性、时效性、高效性问题。通过感知数据集的协同访问,针对数据中心的存储容量限制,提出访问模式感知的数据放置算法,实现跨数据中心数据访问代价优化;由数据放置驱动,通过权衡多数据中心计算和网络能力,针对数据中心间异构、动态变化的计算资源,提出目标数据驱动的任务指派算法,实现批量任务整体完成时间优化;通过感知作业的初始数据布局以及任务间的数据依赖关系,考虑数据中心的存储和计算资源限制,提出数据布局敏感的作业调度算法,实现跨数据中心执行作业的数据流量优化。本项目将为多数据中心环境下科学大数据应用的高效运行提供切实有效的解决方案,具有重要的理论意义和应用价值。

结项摘要

本项目以诺贝尔奖获得者丁肇中教授领导的AMS-02科学实验为研究背景,以多数据中心环境中科学大数据应用的数据布局与执行优化为目标,研究科学数据放置、科学数据生产任务指派、科学工作流作业调度的相关模型和算法,构建多数据中心环境中的科学大数据应用支撑平台原型系统,实现真实科学大数据应用的科学数据放置、科学数据生产任务指派和科学工作流作业调度优化。项目研究具体结果包括:(1)数据放置方面:提出了跨数据中心访问模式感知的数据放置方法、数据中心内的数据热度感知数据放置机制;(2)任务指派方面:提出了任务指派驱动的异构虚拟资源在线分配机制、大规模任务查询和指派方法;(3)作业调度方面:提出了面向科学工作流作业的资源供给机制、跨数据中心的工作流作业调度方法。(4)原型系统方面:实现了多数据中心环境中科学大数据应用支撑平台原型系统。项目组培养了云计算和数据中心网络领域的博士研究生2名,硕士研究生3名;在包括 IEEE TPDS、Cluster Computing、Tsinghua Science and Technology、CCPE、IEEE Network、IEEE Internet Computing、Journal of Computer Science、CHEP、CSCWD、SMC在内的期刊和会议上发表论文22 篇,其中SCI 收录11 篇,EI 收录20篇;申请国家发明专利 1 项。本项目的研究成果将为多数据中心环境,特别是存储、计算和网络资源受限的数据中心环境下的科学大数据应用运行优化,提供了一定的理论支撑和技术方法,对促进大型科学实验支撑计算环境的发展有积极意义,有利于更好发挥科学大数据应用潜在的巨大科学价值。

项目成果

期刊论文数量(11)
专著数量(0)
科研奖励数量(0)
会议论文数量(11)
专利数量(1)
Enabling application-aware flexible graph partition mechanism for parallel graph processing systems
为并行图处理系统启用应用程序感知的灵活图分区机制
  • DOI:
    10.1002/cpe.3849
  • 发表时间:
    --
  • 期刊:
    Concurrency and Computation: Practice and Experience
  • 影响因子:
    --
  • 作者:
    Dong Fang;Zhang Junxue;Luo Junzhou;Shen Dian;Jin Jiahui
  • 通讯作者:
    Jin Jiahui
Querying Web-Scale Knowledge Graphs Through Effective Pruning of Search Space
通过有效修剪搜索空间查询网络规模的知识图
  • DOI:
    10.1109/tpds.2017.2665478
  • 发表时间:
    2017-08-01
  • 期刊:
    IEEE TRANSACTIONS ON PARALLEL AND DISTRIBUTED SYSTEMS
  • 影响因子:
    5.3
  • 作者:
    Jin, Jiahui;Luo, Junzhou;Gao, Lixin
  • 通讯作者:
    Gao, Lixin
COAST: A Cooperative Storage Framework for Mobile Transparent Computing Using Device-to-Device Data Sharing
COAST:使用设备到设备数据共享的移动透明计算的协作存储框架
  • DOI:
    10.1109/mnet.2018.1700173
  • 发表时间:
    2018-01-01
  • 期刊:
    IEEE NETWORK
  • 影响因子:
    9.3
  • 作者:
    Jin, Jiahui;Luo, Junzhou;Xiong, Runqun
  • 通讯作者:
    Xiong, Runqun
Cooperative storage by exploiting graph-based data placement algorithm for edge computing environment
利用基于图的数据放置算法进行边缘计算环境的协作存储
  • DOI:
    10.1002/cpe.4914
  • 发表时间:
    2018
  • 期刊:
    Concurrency and Computation-Practice & Experience
  • 影响因子:
    2
  • 作者:
    Jin Jiahui;Li Yunhao;Luo Junzhou
  • 通讯作者:
    Luo Junzhou
HaDaap: A hotness-aware data placement strategy for improving storage efficiency in heterogeneous Hadoop clusters
HaDaap:一种热感知数据放置策略,用于提高异构 Hadoop 集群中的存储效率
  • DOI:
    10.1002/cpe.4830
  • 发表时间:
    2018
  • 期刊:
    Concurrency and Computation-Practice & Experience
  • 影响因子:
    2
  • 作者:
    Xiong Runqun;Du Yao;Jin Jiahui;Luo Junzhou
  • 通讯作者:
    Luo Junzhou

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

张竞慧的其他基金

面向群智学习应用的端边云协同训练优化机制研究
  • 批准号:
    61972085
  • 批准年份:
    2019
  • 资助金额:
    60 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码