云计算环境下面向大数据的在线聚集并行优化机制研究

结题报告
项目介绍
AI项目解读

基本信息

  • 批准号:
    61572128
  • 项目类别:
    面上项目
  • 资助金额:
    16.0万
  • 负责人:
  • 依托单位:
  • 学科分类:
    F0207.计算机网络
  • 结题年份:
    2016
  • 批准年份:
    2015
  • 项目状态:
    已结题
  • 起止时间:
    2016-01-01 至2016-12-31

项目摘要

Online aggregation evolves the accurate query processing where data are completely scanned into sample-based approximate query processing, which is a essential data processing technology for big data, especially to those application where accuracy is not as important, such as tendency analysis, evaluation, prediction and other data processing scenarios. Current research work of online aggregation focuses on the deployment and implementation problems in cloud environment to ensure the functionality, but ignores the optimization on data organization and task execution concerning the cloud architecture. This project is dedicate to enhancing the performance of online aggregation in cloud environment, focuses on the sampling performance, data placement, concurrent multi-query and estimation failure problems which challenges the current performance of online aggregation in cloud environment, steps further into the mechanisms on data organization and management, concurrent multi-query optimization and query mode switch in the cloud PaaS layer and finally provides technical support for efficient big data approximate concurrent query. This project will implement the online aggregation prototype system in cloud environment that will be deployed on the Southeast University Cloud Platform and apply it to the big data analyze applications such as social network and e-commerce, which will flourish the big data research nationwide.
在线聚集是将面向数据完全扫描的精确查询计算转变成面向随机样本的近似查询计算,在当今的大数据时代,这是一个非常重要数据处理方法,尤其是对查询精度要求不是太高的应用,如趋势分析、评估、预测等数据分析场景中。目前,在线聚集已有的研究工作主要是在现有云计算架构下的部署与实现问题,确保其功能的可用性,没有从云计算架构下的数据组织、任务执行等方面对在线聚集进行性能优化。本项目以提高云环境下在线聚集查询的执行性能为目标,针对当前云环境下影响在线聚集查询执行性能的采样效率、数据放置、多查询的并发和估计失效等问题,深入研究云计算PaaS层面向在线聚集查询的数据组织管理、并发查询优化和查询模式切换的有关机理和机制,为大数据近似估计查询的高效并行计算提供技术支撑。本项目将实现一套云计算在线聚集原型系统,在东南大学云计算平台部署验证,并应用到社交网络、电子商务等大数据分析应用中,推动我国大数据处理的研究。

结项摘要

针对在Hadoop框架下,在线聚集查询作业被分解成若干子任务并指派到合适的节点独立完成各自的随机采样、统计量计算以及近似估计等过程时,没有考虑多查询任务之间的优化问题,首先研究了用户提交的多查询任务到Hadoop并行计算框架的翻译过程,在Hadoop并行计算框架作业级,制定作业合并规则,合并相似查询的作业;其次在Hadoop并行计算框架任务级,研究分析了建立相似查询作业的采样相关性与计算相关性理论模型,使之共享数据采样和统计量计算,减少冗余开销;最后,搭建云计算在线聚集系统的研究试验平台,进一步探究了基于内存计算的可行性。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
CAT: A Cost-Aware Translator for SQL-query workflow to MapReduce jobflow
CAT:用于 SQL 查询工作流到 MapReduce 作业流的成本感知转换器
  • DOI:
    10.1016/j.datak.2015.12.004
  • 发表时间:
    2016-03
  • 期刊:
    Data & Knowledge Engineering
  • 影响因子:
    2.5
  • 作者:
    Aibo Song;Zhiang Wu;Xu Ma;Junzhou Luo
  • 通讯作者:
    Junzhou Luo

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--"}}
  • 发表时间:
    {{ item.publish_year || "--" }}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--"}}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.authors }}

数据更新时间:{{ patent.updateTime }}

其他文献

Partition-Based Online Aggregation with Shared Sampling in the Cloud
基于分区的在线聚合以及云中的共享采样
  • DOI:
    10.1007/s11390-013-1393-6
  • 发表时间:
    2013-11
  • 期刊:
    Journal of Computer Science and Technology
  • 影响因子:
    0.7
  • 作者:
    王宇翔;罗军舟;宋爱波;东方
  • 通讯作者:
    东方
基于动态定价策略的数据中心能耗成本优化
  • DOI:
    --
  • 发表时间:
    2013
  • 期刊:
    计算机学报
  • 影响因子:
    --
  • 作者:
    王巍;罗军舟;宋爱波
  • 通讯作者:
    宋爱波
射频识别数据库中封闭多维路径挖掘
  • DOI:
    --
  • 发表时间:
    --
  • 期刊:
    计算机集成制造系统
  • 影响因子:
    --
  • 作者:
    宋爱波;陈竹西;胡孔法;陈崚;杨俊
  • 通讯作者:
    杨俊
Stochastic modeling of dynamic power management policies in server farms with setup times and server failures
服务器群中动态电源管理策略的设置时间和服务器故障的随机建模
  • DOI:
    10.1002/dac.2761
  • 发表时间:
    2014-04
  • 期刊:
    International Journal of Communication Systems
  • 影响因子:
    2.1
  • 作者:
    宋爱波;王巍;罗军舟
  • 通讯作者:
    罗军舟
网格虚拟组织副本协作预取机制
  • DOI:
    --
  • 发表时间:
    2011
  • 期刊:
    软件学报
  • 影响因子:
    --
  • 作者:
    田田;罗军舟;宋爱波;伍志昂
  • 通讯作者:
    伍志昂

其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi || "--" }}
  • 发表时间:
    {{ item.publish_year || "--"}}
  • 期刊:
    {{ item.journal_name }}
  • 影响因子:
    {{ item.factor || "--" }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}
empty
内容获取失败,请点击重试
重试联系客服
title开始分析
查看分析示例
此项目为已结题,我已根据课题信息分析并撰写以下内容,帮您拓宽课题思路:

AI项目思路

AI技术路线图

宋爱波的其他基金

云环境下面向大数据并行计算的工作流执行优化研究
  • 批准号:
    61370207
  • 批准年份:
    2013
  • 资助金额:
    76.0 万元
  • 项目类别:
    面上项目
云计算环境下基于维存储的OLAP聚集计算关键技术研究
  • 批准号:
    61070161
  • 批准年份:
    2010
  • 资助金额:
    33.0 万元
  • 项目类别:
    面上项目
基于网格环境的高维OLAP数据联机分析与处理技术研究
  • 批准号:
    60773103
  • 批准年份:
    2007
  • 资助金额:
    29.0 万元
  • 项目类别:
    面上项目

相似国自然基金

{{ item.name }}
  • 批准号:
    {{ item.ratify_no }}
  • 批准年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}

相似海外基金

{{ item.name }}
{{ item.translate_name }}
  • 批准号:
    {{ item.ratify_no }}
  • 财政年份:
    {{ item.approval_year }}
  • 资助金额:
    {{ item.support_num }}
  • 项目类别:
    {{ item.project_type }}
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了

AI项目解读示例

课题项目:调控A型流感病毒诱导IFN-β表达的机制研究

AI项目摘要:

本研究聚焦于TRIM2蛋白在A型流感病毒诱导的IFN-β表达中的调控机制。A型流感病毒是全球性健康问题,其感染可导致严重的呼吸道疾病。IFN-β作为关键的抗病毒因子,其表达水平对抗病毒防御至关重要。然而,TRIM2如何调控IFN-β的表达尚未明确。本研究假设TRIM2通过与病毒RNA或宿主因子相互作用,影响IFN-β的产生。我们将采用分子生物学、细胞生物学和免疫学方法,探索TRIM2与A型流感病毒诱导IFN-β表达的关系。预期结果将揭示TRIM2在抗病毒免疫反应中的作用,为开发新的抗病毒策略提供理论基础。该研究对理解宿主抗病毒机制具有重要科学意义,并可能对临床治疗流感病毒感染提供新的视角。

AI项目思路:

科学问题:TRIM2如何调控A型流感病毒诱导的IFN-β表达?
前期研究:已有研究表明TRIM2参与抗病毒反应,但其具体机制尚不明确。
研究创新点:本研究将深入探讨TRIM2在IFN-β表达中的直接作用机制。
技术路线:包括病毒学、分子生物学、细胞培养和免疫检测技术。
关键技术:TRIM2与病毒RNA的相互作用分析,IFN-β启动子活性检测。
实验模型:使用A型流感病毒感染的细胞模型进行研究。

AI技术路线图

        graph TD
          A[研究起始] --> B[文献回顾与假设提出]
          B --> C[实验设计与方法学准备]
          C --> D[A型流感病毒感染模型建立]
          D --> E[TRIM2与病毒RNA相互作用分析]
          E --> F[TRIM2对IFN-β启动子活性的影响]
          F --> G[IFN-β表达水平测定]
          G --> H[TRIM2功能丧失与获得研究]
          H --> I[数据收集与分析]
          I --> J[结果解释与科学验证]
          J --> K[研究结论与未来方向]
          K --> L[研究结束]
      
关闭
close
客服二维码