II-EN: Hadoop NextGen Infrastructure for Heterogeneous Approaches to Data-Intensive Computing

II-EN:用于数据密集型计算异构方法的 Hadoop NextGen 基础设施

基本信息

  • 批准号:
    1405688
  • 负责人:
  • 金额:
    $ 49.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2014
  • 资助国家:
    美国
  • 起止时间:
    2014-08-01 至 2017-07-31
  • 项目状态:
    已结题

项目摘要

The ability for organizations to process enormous quantities of data and to extract insights from those data has revolutionized commerce and science. This phenomenon, known as "big data", is shaping the very fabric of our society. Our insatiable appetite for more data, and knowledge from the data, requires significant computational infrastructure for storage and analytical capabilities. Continued investments in infrastructure for academic researchers are vital from two perspectives: From the research perspective, the university's ability to help advance the state of the art in big data technologies is dependent on access to the right computational resources. From the educational perspective, the university's mission to train the next generation of scientists and engineers cannot be successfully accomplished without big data infrastructure that is becoming essential to their careers. The goal of this project is to provide computational resources to researchers at the University of Maryland to continuing envisioning the future of big data.The modern empirical approach to tackling many challenges in natural language processing, information retrieval, data mining, machine learning, and other related domains involves exploiting large amounts of data to learn statistical models that are able to capture characteristics of the problem. A necessary ingredient to this "big data" approach is scalable infrastructure that can distribute computations across a cluster of machines. Hadoop, the open-source implementation of MapReduce, has achieved widespread adoption as the de facto platform for data-intensive computing.Broadly speaking, MapReduce excels at large-scale content analysis in an offline, batch setting. However, this is not enough: we need a data-intensive computing platform that supports heterogeneous models of computation. Hadoop NextGen (aka YARN), provides exactly this: it allows a physical cluster to support a wide range of computational models via a generic resource allocation framework.This project supports the acquisition of a Hadoop NextGen cluster at the University of Maryland to support the following activities:1. To explore computational models beyond MapReduce, including batch/online tradeoffs in machine learning, real-time streaming computations, and graph processing.2. To sustain innovations in algorithms for content analysis as well as modeling implicit and latent relationships between heterogeneous content (text, images, graphs, etc.) at scale.3. To exploit novel hardware architectures for data-intensive computing (e.g., Graphics Processing Units and Solid State Drives).These resources will help the Laboratory for Computational Linguistics and Information Processing (CLIP) and collaborators at the University of Maryland sustain and enhance its successful record of innovation and the integration of research and education.
组织处理大量数据并从这些数据中提取见解的能力已经彻底改变了商业和科学。这种被称为“大数据”的现象正在塑造我们社会的结构。我们对更多数据和来自数据的知识的贪得无厌的胃口需要大量的计算基础设施来存储和分析功能。 从两个角度来看,对学术研究人员基础设施的持续投资至关重要:从研究角度来看,大学帮助推进大数据技术发展的能力取决于获得正确的计算资源。从教育的角度来看,如果没有对他们的职业生涯至关重要的大数据基础设施,大学培养下一代科学家和工程师的使命就无法成功完成。 该项目的目标是为马里兰州大学的研究人员提供计算资源,以继续设想大数据的未来。现代经验方法解决自然语言处理,信息检索,数据挖掘,机器学习和其他相关领域的许多挑战,涉及利用大量数据来学习能够捕捉问题特征的统计模型。这种“大数据”方法的一个必要组成部分是可扩展的基础设施,可以将计算分布在机器集群中。Hadoop是MapReduce的开源实现,作为数据密集型计算的事实上的平台,它已经获得了广泛的采用。从广义上讲,MapReduce在离线批量设置下的大规模内容分析方面表现出色。然而,这还不够:我们需要一个支持异构计算模型的数据密集型计算平台。Hadoop NextGen(又名YARN)正是提供了这一点:它允许物理集群通过通用的资源分配框架来支持广泛的计算模型。该项目支持马里兰州大学收购Hadoop NextGen集群,以支持以下活动:1.探索MapReduce之外的计算模型,包括 机器学习中的批处理/在线权衡,实时流 计算和图形处理。为了保持内容分析算法的创新, 作为建模异构之间的隐式和潜在的关系, 内容(文本、图像、图表等)按比例3.为了开发新的硬件架构, 计算(例如,这些资源将帮助马里兰州大学的计算语言学和信息处理实验室(CLIP)及其合作者维持和加强其创新和研究与教育一体化的成功记录。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jimmy Lin其他文献

PartsList: a web-based system for dynamically ranking protein folds based on disparate attributes, including whole-genome expression and interaction information.
PartsList:一个基于网络的系统,用于根据不同的属性(包括全基因组表达和相互作用信息)对蛋白质折叠进行动态排名。
  • DOI:
  • 发表时间:
    2001
  • 期刊:
  • 影响因子:
    14.9
  • 作者:
    Jiang Qian;Brad Stenger;Cyrus A. Wilson;Jimmy Lin;R. Jansen;S. Teichmann;Jong H. Park;W. G. Krebs;Haiyuan Yu;Vadim Alexandrov;N. Echols;M. Gerstein
  • 通讯作者:
    M. Gerstein
Sensornet
传感器网
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Rodney Topor;Kenneth Salem;Amarnath Gupta;K. Goda;John F. Gehrke;N. Palmer;Mohamed Sharaf;Alexandros Labrinidis;J. Roddick;Ariel Fuxman;Renée J. Miller;Wang;Anastasios Kementsietsidis;Philippe Bonnet;D. Shasha;Ronald Peikert;Bertram Ludäscher;S. Bowers;T. McPhillips;Harald Naumann;K. Voruganti;J. Domingo;Ben Carterette;Panagiotis G. Ipeirotis;Marcelo Arenas;Y. Manolopoulos;Y. Theodoridis;V. Tsotras;B. Carminati;Jan Jurjens;Eduardo B. Fernandez;Murat Kantarcıoǧlu;Jaideep Vaidya;Indrakshi Ray;Athena Vakali;Cristina Sirangelo;E. Pitoura;Himanshu Gupta;Surajit Chaudhuri;G. Weikum;Ulf Leser;David W. Embley;Fausto Giunchiglia;P. Shvaiko;Mikalai Yatskevich;Edward Y. Chang;Christine Parent;S. Spaccapietra;E. Zimányi;G. Anadiotis;S. Kotoulas;Ronny Siebes;Grigoris Antoniou;D. Plexousakis;J. Bailey;François Bry;Tim Furche;Sebastian Schaffert;David Martin;Gregory D. Speegle;Krithi Ramamritham;P. Chrysanthis;Kai;Stéphane Bressan;S. Abiteboul;D. Suciu;G. Dobbie;Tok Wang Ling;Sugato Basu;Ramesh Govindan;Michael H. Böhlen;C. S. Jensen;Jianyong Wang;K. Vidyasankar;A. Chan;Serge Mankovski;S. Elnikety;P. Valduriez;Yannis Velegrakis;Mario A. Nascimento;Michael Huggett;Andrew U. Frank;Yanchun Zhang;Guandong Xu;R. Snodgrass;Alan Fekete;Marcus Herzog;Konstantinos Morfonios;Y. Ioannidis;E. Wohlstadter;M. Matera;F. Schwagereit;Steffen Staab;Keir Fraser;Jingren Zhou;M. Mokbel;Walid G. Aref;Mirella M. Moro;Markus Schneider;Panos Kalnis;Gabriel Ghinita;Michael F. Goodchild;Shashi Shekhar;James Kang;Vijayaprasath Gandhi;Nikos Mamoulis;Betsy George;Michel Scholl;Agnès Voisard;Ralf Hartmut Güting;Yufei Tao;Dimitris Papadias;Peter Revesz;G. Kollios;E. Frentzos;Apostolos N. Papadopoulos;Bernhard Thalheim;Jovan Pehcevski;Benjamin Piwowarski;S. Theodoridis;Konstantinos Koutroumbas;George Karabatis;Don Chamberlin;Philip A. Bernstein;Michael H. Böhlen;J. Gamper;Ping Li;Kazimierz Subieta;S. Harizopoulos;Ethan Zhang;Yi Zhang;Theodore Johnson;Hans;S. Fienberg;Jiashun Jin;Radu Sion;C. Paice;Nikos Hardavellas;Ippokratis Pandis;Edie M. Rasmussen;Hiroshi Yoshida;G. Graefe;Bernd Reiner;Karl Hahn;K. Wada;T. Risch;Jiawei Han;Bolin Ding;Lukasz Golab;Michael Stonebraker;Bibudh Lahiri;Srikanta Tirthapura;Erik Vee;Yanif Ahmad;U. Çetintemel;Mitch Cherniack;S. Zdonik;Mariano P. Consens;M. Lalmas;R. Baeza;D. Hiemstra;Peer Krögerand;Arthur Zimek;Nick Craswell;Carson Kai;Maxime Crochemore;Thierry Lecroq;Arie Shoshani;Jimmy Lin;Hwanjo Yu;David B. Lomet;H. Hinterberger;Ninghui Li;Phillip B. Gibbons;Mouna Kacimi;Thomas Neumann
  • 通讯作者:
    Thomas Neumann
The Maryland Modular Method: An Approach to Doctoral Education in Information Studies
马里兰模块化方法:信息研究博士教育的一种方法
Resources for Brewing BEIR: Reproducible Reference Models and Statistical Analyses
酿造 BEIR 的资源:可重复的参考模型和统计分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ehsan Kamalloo;Nandan Thakur;Carlos Lassance;Jimmy Lin
  • 通讯作者:
    Jimmy Lin
SmartProbe: A Virtual Moderator for Market Research Surveys
SmartProbe:市场研究调查的虚拟主持人
  • DOI:
    10.48550/arxiv.2305.08271
  • 发表时间:
    2023
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Joshua Seltzer;Jia;Kathy Cheng;Yuxiao Sun;Santosh Kolagati;Jimmy Lin;Shi Zong
  • 通讯作者:
    Shi Zong

Jimmy Lin的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jimmy Lin', 18)}}的其他基金

Student Travel Support for the 2014 IEEE International Conference on Big Data
2014 年 IEEE 国际大数据会议学生旅行支持
  • 批准号:
    1444666
  • 财政年份:
    2014
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Providing Relevant and Timely Results: Real-Time Search Architectures and Relevance Algorithms
III:小型:提供相关且及时的结果:实时搜索架构和相关性算法
  • 批准号:
    1218043
  • 财政年份:
    2012
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
EAGER: Learning to Efficiently Rank with Cascades
EAGER:学习使用级联进行有效排名
  • 批准号:
    1144034
  • 财政年份:
    2011
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Continuing Grant
DC: Small: Cross-Language Bayesian Models for Web-Scale Text Analysis Using MapReduce
DC:小型:使用 MapReduce 进行 Web 规模文本分析的跨语言贝叶斯模型
  • 批准号:
    1018625
  • 财政年份:
    2010
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Ivory -- A Hadoop Toolkit for Distributed Text Retrieval
III:小:Ivory——分布式文本检索的 Hadoop 工具包
  • 批准号:
    0916043
  • 财政年份:
    2009
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
2009 PI Meeting for the Cluster Exploratory Program
2009年集群探索计划PI会议
  • 批准号:
    0957954
  • 财政年份:
    2009
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Putting the Clouds in Context: Statistical Machine Translation with MapReduce
将云放在上下文中:使用 MapReduce 进行统计机器翻译
  • 批准号:
    0836560
  • 财政年份:
    2008
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant

相似国自然基金

EN1通过USP18去泛素化调控ACLY蛋白稳定性诱导脂质代谢重编程促进膀胱癌进展的机制研究
  • 批准号:
    2025JJ50549
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
儿童 IBD 采用EN 联合微生态制剂治疗的临床疗效及对肠道菌群、微炎症状态与免疫系统的影响
  • 批准号:
    2024JJ7051
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
微流控集成3D打印构建毛囊嵌合器官芯片通过乳酸/Bmp2/En1轴介导创面毛囊再生及无瘢痕愈合
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    15.0 万元
  • 项目类别:
    省市级项目
膜整联蛋白β8入核调控En1-SP1磷酸化在硬腭黏膜无瘢痕愈合中的作用研究
  • 批准号:
    82370928
  • 批准年份:
    2023
  • 资助金额:
    48 万元
  • 项目类别:
    面上项目
CDots调控EN1抑制纤维化促进头颈部放射性溃疡愈合的作用和机制研究
  • 批准号:
    82301026
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
向心性动态收缩水凝胶缓释P17抑制EN1基因激活在无瘢痕愈合中的应用及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
乌梅麝香膏通过抑制En1介导的促纤维化在治疗增生性瘢痕中的作用及机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    51 万元
  • 项目类别:
    面上项目
RUNX2、FOXG1和EN1组成的核心转录调控回路促进乳腺叶状肿瘤恶性进展的机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    54.7 万元
  • 项目类别:
    面上项目
胆汁酸-FXR-SHP通路在Roux-en-Y胃旁路术改善T2DM中的作用及机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
脂肪干细胞工程化纳米囊泡(ADSC-EN)自组装修饰胶原支架修复骨缺损的应用与机理研究
  • 批准号:
    82002067
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Conference: GAeL XXXI (Geometrie Algebrique en Liberte)
会议:GAeL XXXI(自由几何代数)
  • 批准号:
    2408333
  • 财政年份:
    2024
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Creating and Sustaining Noyce Mentors en la Frontera: a HSI Collaborative Capacity Building Grant
在拉弗龙特拉创建和维持诺伊斯导师:HSI 协作能力建设补助金
  • 批准号:
    2345011
  • 财政年份:
    2024
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Conference: GAeL 2023 (Geometrie Algebrique en Liberte)
会议:GAeL 2023(Geometrie Algebrique en Liberte)
  • 批准号:
    2309424
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
RCN: GOLD-EN: Virtual Ice Community Engagement
RCN:GOLD-EN:虚拟冰社区参与
  • 批准号:
    2329416
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Dérivation et validation d'un outil de stratification du risque applicable en préhospitalier pour déterminer le risque qu'une personne âgée nécessite des soins d'urgence et/ou une hospitalisation après une chute
在住院前适用的风险分层的衍生和验证是确定风险人员的必要条件,是住院后紧急情况和住院治疗所必需的
  • 批准号:
    479568
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Operating Grants
Soutenir les pratiques de pointe en contexte de pénurie de main d'œuvre : Implantation et évaluation d'un outil d'aide à la décision pour la dotation du personnel infirmier en CHSLD
Soutenir les pratiques de pointe en contexte de pénurie de main dÅuvre : 植入和评估 dun outil daide à la décision pour la dotation du person infirmier en CHSLD
  • 批准号:
    480717
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Miscellaneous Programs
Les demandes anticipées d'aide médicale à mourir en contexte de troubles neurocognitifs majeurs: Perspective citoyenne autour des enjeux de santé
Les Demandes anticipées daide médicale à mourir en contexte de Troubles Neurocognitifs majeurs: Perspective citoyenne autour des enjeux de santé©
  • 批准号:
    485647
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Miscellaneous Programs
Améliorer la prédiction du risque cardiovasculaire en considérant les stresseurs psychosociaux au travail
危险心血管预测的改善者,考虑社会心理和劳动压力
  • 批准号:
    489281
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Operating Grants
Une ethnographie critique pour comprendre la pratique infirmière à l'égard des bénévoles en centre d'hébergement
民族志批判对身体虚弱的实践和福利中心的福利的批判
  • 批准号:
    498001
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
Organogenèse de muqueuse nasale autologue pour la reconstruction endoscopique endonasale en chirurgie de la base du crâne
鼻内自体自体组织生成器用于重建内窥镜鼻内手术和基础手术
  • 批准号:
    478351
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Operating Grants
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了