Optimizing hadoop to scale to big systems and big-data

优化 hadoop 以扩展到大系统和大数据

基本信息

  • 批准号:
    485325-2015
  • 负责人:
  • 金额:
    $ 5.77万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Collaborative Research and Development Grants
  • 财政年份:
    2017
  • 资助国家:
    加拿大
  • 起止时间:
    2017-01-01 至 2018-12-31
  • 项目状态:
    已结题

项目摘要

The overall `big-data' market is expected to be worth more than \$100 billion and growing roughly twice as fast as the software business as a whole [Deloitte]. The emergence of "big data", such as social media, has played critical roles in business analytics. As an IDC report indicates data analysis will play a key role in managing traffic in canadian cities (e.g., Toronto) and healthcare. Such big data is often stored in the new generation of NoSQL databases, and processed by massively parallel MapReduce/Hadoop based infrastructure. The industryis facing an essential challenge: can millions of existing successful applications based on SQL take the advantage of big data infrastructure? Many critical challenges remain including the design of optimal data storage formats and efficient communication of data between data storage nodes. In this project, we will be working with our partner, Simba, an industry leader of big data technology and has guided us towards the challenges that forsee from their client's perspective. We will be making three specific contributions i) Low-latency: We will be adapting Apache Hive (open source Hadoop-based NoSQL framework) to take advantage of RDMA (Remote Direct Memory Accesses) networks and scale out to take advantage of rack scale memory resources. ii) Reducing Bandwidth: We will be developing data-specific compression mechanisms to minimize the data movement across the compute rack and enable both an increase in database volume and data access speed, and iii) ``Flexibility": We will be developing a tool for enabling Apache Hive to dynamically enforce schemas and enable end-client SQL-based business analytic tools to interact with NoSQL database backends employed by Hadoop.We also plan to integrate our changes into the open source Apache Hive platform to benefit the wider Big data community.
整个“大数据”市场的价值预计将超过1000亿美元,增长速度大约是整个软件行业的两倍[德勤]。社交媒体等“大数据”的出现在商业分析中发挥了关键作用。IDC的一份报告显示,数据分析将在加拿大城市的交通管理中发挥关键作用(例如,多伦多)和医疗保健。这些大数据通常存储在新一代NoSQL数据库中,并由基于MapReduce/Hadoop的大规模并行基础设施处理。行业正面临着一个重要的挑战:数百万现有的基于SQL的成功应用程序能否利用大数据基础设施?许多关键挑战仍然存在,包括最佳数据存储格式的设计和数据存储节点之间的高效数据通信。在这个项目中,我们将与我们的合作伙伴Simba合作,Simba是大数据技术的行业领导者,并从客户的角度指导我们应对挑战。我们将做出三个具体的贡献i)低延迟:我们将调整Apache Hive(基于Hadoop的开源NoSQL框架),以利用RDMA(远程直接内存访问)网络,并向外扩展以利用机架规模的内存资源。2.减少带宽:我们将开发数据特定的压缩机制,以尽量减少计算机架上的数据移动,并增加数据库容量和数据访问速度,以及iii)"灵活性”:我们将开发一个工具,使Apache Hive能够动态实施模式并启用终端客户端SQL-我们还计划将我们的变化集成到开源Apache Hive平台中,以使更广泛的人受益。大数据社区

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Shriraman, Arrvindh其他文献

Shriraman, Arrvindh的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Shriraman, Arrvindh', 18)}}的其他基金

Self-Sketching Domain Specific Accelerators: Build Hardware from Software
自绘制领域特定加速器:从软件构建硬件
  • 批准号:
    RGPIN-2018-06795
  • 财政年份:
    2022
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Discovery Grants Program - Individual
Self-Sketching Domain Specific Accelerators: Build Hardware from Software
自绘制领域特定加速器:从软件构建硬件
  • 批准号:
    RGPIN-2018-06795
  • 财政年份:
    2021
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Discovery Grants Program - Individual
Self-Sketching Domain Specific Accelerators: Build Hardware from Software
自绘制领域特定加速器:从软件构建硬件
  • 批准号:
    RGPIN-2018-06795
  • 财政年份:
    2020
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Discovery Grants Program - Individual
Optimizing hadoop to scale to big systems and big-data
优化 hadoop 以扩展到大系统和大数据
  • 批准号:
    485325-2015
  • 财政年份:
    2019
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Collaborative Research and Development Grants
Self-Sketching Domain Specific Accelerators: Build Hardware from Software
自绘制领域特定加速器:从软件构建硬件
  • 批准号:
    RGPIN-2018-06795
  • 财政年份:
    2019
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Discovery Grants Program - Individual
Self-Sketching Domain Specific Accelerators: Build Hardware from Software
自绘制领域特定加速器:从软件构建硬件
  • 批准号:
    RGPIN-2018-06795
  • 财政年份:
    2018
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Discovery Grants Program - Individual
High performance computer vision on low performance hardware
低性能硬件上的高性能计算机视觉
  • 批准号:
    522765-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Engage Grants Program
Programmable memory systems for manycore architectures
适用于众核架构的可编程内存系统
  • 批准号:
    402849-2011
  • 财政年份:
    2017
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Discovery Grants Program - Individual
Software framework for Smart building energy audits
智能建筑能源审计的软件框架
  • 批准号:
    498931-2016
  • 财政年份:
    2016
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Engage Grants Program
Optimizing hadoop to scale to big systems and big-data
优化 hadoop 以扩展到大系统和大数据
  • 批准号:
    485325-2015
  • 财政年份:
    2016
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Collaborative Research and Development Grants

相似国自然基金

基于在线优化的Hadoop YARN平台下资源分配机制研究
  • 批准号:
    61802060
  • 批准年份:
    2018
  • 资助金额:
    27.0 万元
  • 项目类别:
    青年科学基金项目
基于hadoop技术的住院患者用药错误风险预警与干预
  • 批准号:
    2018JJ2597
  • 批准年份:
    2018
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
多维气候大数据存储与处理关键技术研究
  • 批准号:
    61672312
  • 批准年份:
    2016
  • 资助金额:
    64.0 万元
  • 项目类别:
    面上项目
HDFS读、写性能概率建模与模型迁移方法研究
  • 批准号:
    61502379
  • 批准年份:
    2015
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
Hadoop云存储中基于Ordinal Bloom filter的多维索引关键技术研究
  • 批准号:
    61363021
  • 批准年份:
    2013
  • 资助金额:
    45.0 万元
  • 项目类别:
    地区科学基金项目
高能物理数据分析的Hadoop/HBASE平台研究
  • 批准号:
    11375223
  • 批准年份:
    2013
  • 资助金额:
    92.0 万元
  • 项目类别:
    面上项目
大数据挖掘在科技项目查重中的应用研究
  • 批准号:
    71303223
  • 批准年份:
    2013
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
云计算Hadoop框架中高效迭代机制的研究
  • 批准号:
    61201447
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
基于Hadoop的气象云存储与数据处理平台的研究
  • 批准号:
    41275116
  • 批准年份:
    2012
  • 资助金额:
    80.0 万元
  • 项目类别:
    面上项目
基于Hadoop的分布式并行联机分析处理技术研究
  • 批准号:
    61173028
  • 批准年份:
    2011
  • 资助金额:
    54.0 万元
  • 项目类别:
    面上项目

相似海外基金

Optimizing hadoop to scale to big systems and big-data
优化 hadoop 以扩展到大系统和大数据
  • 批准号:
    485325-2015
  • 财政年份:
    2019
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Collaborative Research and Development Grants
Development of a Homogeneous Data Management and Visualization System for Astronomical Multi-Wavelength Open Images Enabled by a Reverse Projection Method onto the Celestial Sphere
开发天文多波长开放图像的均匀数据管理和可视化系统,通过逆向投影方法实现天球
  • 批准号:
    19K12244
  • 财政年份:
    2019
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
SHF: EAGER: HI-HDFS - Holistic I/O optimizations for the Hadoop distributed filesystem
SHF:EAGER:HI-HDFS - Hadoop 分布式文件系统的整体 I/O 优化
  • 批准号:
    1747447
  • 财政年份:
    2017
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Standard Grant
A unified access server for SQL-on-Hadoop systems
SQL-on-Hadoop系统的统一访问服务器
  • 批准号:
    501015-2016
  • 财政年份:
    2016
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Engage Grants Program
Optimizing hadoop to scale to big systems and big-data
优化 hadoop 以扩展到大系统和大数据
  • 批准号:
    485325-2015
  • 财政年份:
    2016
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Collaborative Research and Development Grants
The collaborative management system of computing and networking resources for multimedia big data
多媒体大数据计算与网络资源协同管理系统
  • 批准号:
    16F16349
  • 财政年份:
    2016
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Grant-in-Aid for JSPS Fellows
Preliminary study of an inexpensive implementation methodology for an all-sky oriented astronomical data archive system powered by Hadoop for huge observational multi-wavelength data set
Hadoop支持的海量多波长观测数据集全天空天文数据归档系统廉价实现方法的初步研究
  • 批准号:
    15K17501
  • 财政年份:
    2015
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Grant-in-Aid for Young Scientists (B)
Discovery and Composition of Web Services on Big Data of a Linked Services Network
链接服务网络大数据上Web服务的发现和组合
  • 批准号:
    15K00428
  • 财政年份:
    2015
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Study of generation of aggregated symbolic data from large data
大数据生成聚合符号数据的研究
  • 批准号:
    15K00059
  • 财政年份:
    2015
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
EAGER: NDN-Hadoop: Exploring Applicability of NDN for Big-Data Computing
EAGER:NDN-Hadoop:探索 NDN 在大数据计算中的适用性
  • 批准号:
    1551057
  • 财政年份:
    2015
  • 资助金额:
    $ 5.77万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了