III: Small: Ivory -- A Hadoop Toolkit for Distributed Text Retrieval
III:小:Ivory——分布式文本检索的 Hadoop 工具包
基本信息
- 批准号:0916043
- 负责人:
- 金额:$ 49.97万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-10-01 至 2013-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Text search is a technology that is vital for modern information-based societies. Today's systems face the daunting challenge of handling quantities of text previously unimaginable. Cluster computing is the only practical solution for addressing the issue of scale. This project leverages the MapReduce framework (via the open-source Hadoop implementation) to tackle issues of robustness and scalability in processing large amounts of data for information retrieval applications. More generally, the goals are to explore the relationship between processor, disk, memory, and network in large distributed computing environments, where many assumptions made in single machines no longer hold. One pertinent example is the fundamental mismatch between Hadoop and the demands of real-time interactive applications. Because it was designed for throughput-oriented batch processing, Hadoop currently does not provide low-latency disk access necessary for real-time search. A distributed in-memory object caching architecture provides a potential solution to this problem.To achieve broader impact, the results of this research will be implemented in Ivory, an open-source toolkit for distributed information retrieval built from the ground up with cluster architectures in mind. The availability of this toolkit will help sustain activities in the emerging area of "cloud computing". Additional information is available on the project website (http://www.umiacs.umd.edu/~jimmylin/cloud-computing).
文本搜索是现代信息社会的一项重要技术。今天的系统面临着处理以前难以想象的大量文本的艰巨挑战。集群计算是解决规模问题的唯一实际解决方案。该项目利用MapReduce框架(通过开源Hadoop实现)来解决信息检索应用程序在处理大量数据时的健壮性和可伸缩性问题。更一般地说,目标是探索大型分布式计算环境中处理器、磁盘、内存和网络之间的关系,在这种环境中,在单个机器中做出的许多假设不再成立。一个相关的例子是Hadoop与实时交互应用程序需求之间的根本不匹配。因为它是为面向吞吐量的批处理而设计的,Hadoop目前不提供实时搜索所需的低延迟磁盘访问。分布式内存中对象缓存架构为这个问题提供了一个潜在的解决方案。为了获得更广泛的影响,这项研究的结果将在Ivory中实现,Ivory是一个分布式信息检索的开源工具包,从底层开始构建,考虑到集群架构。该工具包的可用性将有助于维持“云计算”这一新兴领域的活动。更多信息请访问项目网站(http://www.umiacs.umd.edu/~jimmylin/cloud-computing)。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jimmy Lin其他文献
PartsList: a web-based system for dynamically ranking protein folds based on disparate attributes, including whole-genome expression and interaction information.
PartsList:一个基于网络的系统,用于根据不同的属性(包括全基因组表达和相互作用信息)对蛋白质折叠进行动态排名。
- DOI:
- 发表时间:
2001 - 期刊:
- 影响因子:14.9
- 作者:
Jiang Qian;Brad Stenger;Cyrus A. Wilson;Jimmy Lin;R. Jansen;S. Teichmann;Jong H. Park;W. G. Krebs;Haiyuan Yu;Vadim Alexandrov;N. Echols;M. Gerstein - 通讯作者:
M. Gerstein
Sensornet
传感器网
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Rodney Topor;Kenneth Salem;Amarnath Gupta;K. Goda;John F. Gehrke;N. Palmer;Mohamed Sharaf;Alexandros Labrinidis;J. Roddick;Ariel Fuxman;Renée J. Miller;Wang;Anastasios Kementsietsidis;Philippe Bonnet;D. Shasha;Ronald Peikert;Bertram Ludäscher;S. Bowers;T. McPhillips;Harald Naumann;K. Voruganti;J. Domingo;Ben Carterette;Panagiotis G. Ipeirotis;Marcelo Arenas;Y. Manolopoulos;Y. Theodoridis;V. Tsotras;B. Carminati;Jan Jurjens;Eduardo B. Fernandez;Murat Kantarcıoǧlu;Jaideep Vaidya;Indrakshi Ray;Athena Vakali;Cristina Sirangelo;E. Pitoura;Himanshu Gupta;Surajit Chaudhuri;G. Weikum;Ulf Leser;David W. Embley;Fausto Giunchiglia;P. Shvaiko;Mikalai Yatskevich;Edward Y. Chang;Christine Parent;S. Spaccapietra;E. Zimányi;G. Anadiotis;S. Kotoulas;Ronny Siebes;Grigoris Antoniou;D. Plexousakis;J. Bailey;François Bry;Tim Furche;Sebastian Schaffert;David Martin;Gregory D. Speegle;Krithi Ramamritham;P. Chrysanthis;Kai;Stéphane Bressan;S. Abiteboul;D. Suciu;G. Dobbie;Tok Wang Ling;Sugato Basu;Ramesh Govindan;Michael H. Böhlen;C. S. Jensen;Jianyong Wang;K. Vidyasankar;A. Chan;Serge Mankovski;S. Elnikety;P. Valduriez;Yannis Velegrakis;Mario A. Nascimento;Michael Huggett;Andrew U. Frank;Yanchun Zhang;Guandong Xu;R. Snodgrass;Alan Fekete;Marcus Herzog;Konstantinos Morfonios;Y. Ioannidis;E. Wohlstadter;M. Matera;F. Schwagereit;Steffen Staab;Keir Fraser;Jingren Zhou;M. Mokbel;Walid G. Aref;Mirella M. Moro;Markus Schneider;Panos Kalnis;Gabriel Ghinita;Michael F. Goodchild;Shashi Shekhar;James Kang;Vijayaprasath Gandhi;Nikos Mamoulis;Betsy George;Michel Scholl;Agnès Voisard;Ralf Hartmut Güting;Yufei Tao;Dimitris Papadias;Peter Revesz;G. Kollios;E. Frentzos;Apostolos N. Papadopoulos;Bernhard Thalheim;Jovan Pehcevski;Benjamin Piwowarski;S. Theodoridis;Konstantinos Koutroumbas;George Karabatis;Don Chamberlin;Philip A. Bernstein;Michael H. Böhlen;J. Gamper;Ping Li;Kazimierz Subieta;S. Harizopoulos;Ethan Zhang;Yi Zhang;Theodore Johnson;Hans;S. Fienberg;Jiashun Jin;Radu Sion;C. Paice;Nikos Hardavellas;Ippokratis Pandis;Edie M. Rasmussen;Hiroshi Yoshida;G. Graefe;Bernd Reiner;Karl Hahn;K. Wada;T. Risch;Jiawei Han;Bolin Ding;Lukasz Golab;Michael Stonebraker;Bibudh Lahiri;Srikanta Tirthapura;Erik Vee;Yanif Ahmad;U. Çetintemel;Mitch Cherniack;S. Zdonik;Mariano P. Consens;M. Lalmas;R. Baeza;D. Hiemstra;Peer Krögerand;Arthur Zimek;Nick Craswell;Carson Kai;Maxime Crochemore;Thierry Lecroq;Arie Shoshani;Jimmy Lin;Hwanjo Yu;David B. Lomet;H. Hinterberger;Ninghui Li;Phillip B. Gibbons;Mouna Kacimi;Thomas Neumann - 通讯作者:
Thomas Neumann
The Maryland Modular Method: An Approach to Doctoral Education in Information Studies
马里兰模块化方法:信息研究博士教育的一种方法
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
A. Druin;P. Jaeger;J. Golbeck;K. Fleischmann;Jimmy Lin;Yan Qu;Ping Wang;Bo Xie - 通讯作者:
Bo Xie
Resources for Brewing BEIR: Reproducible Reference Models and Statistical Analyses
酿造 BEIR 的资源:可重复的参考模型和统计分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Ehsan Kamalloo;Nandan Thakur;Carlos Lassance;Jimmy Lin - 通讯作者:
Jimmy Lin
SmartProbe: A Virtual Moderator for Market Research Surveys
SmartProbe:市场研究调查的虚拟主持人
- DOI:
10.48550/arxiv.2305.08271 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Joshua Seltzer;Jia;Kathy Cheng;Yuxiao Sun;Santosh Kolagati;Jimmy Lin;Shi Zong - 通讯作者:
Shi Zong
Jimmy Lin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jimmy Lin', 18)}}的其他基金
Student Travel Support for the 2014 IEEE International Conference on Big Data
2014 年 IEEE 国际大数据会议学生旅行支持
- 批准号:
1444666 - 财政年份:2014
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
II-EN: Hadoop NextGen Infrastructure for Heterogeneous Approaches to Data-Intensive Computing
II-EN:用于数据密集型计算异构方法的 Hadoop NextGen 基础设施
- 批准号:
1405688 - 财政年份:2014
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
III: Small: Providing Relevant and Timely Results: Real-Time Search Architectures and Relevance Algorithms
III:小型:提供相关且及时的结果:实时搜索架构和相关性算法
- 批准号:
1218043 - 财政年份:2012
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
EAGER: Learning to Efficiently Rank with Cascades
EAGER:学习使用级联进行有效排名
- 批准号:
1144034 - 财政年份:2011
- 资助金额:
$ 49.97万 - 项目类别:
Continuing Grant
DC: Small: Cross-Language Bayesian Models for Web-Scale Text Analysis Using MapReduce
DC:小型:使用 MapReduce 进行 Web 规模文本分析的跨语言贝叶斯模型
- 批准号:
1018625 - 财政年份:2010
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
2009 PI Meeting for the Cluster Exploratory Program
2009年集群探索计划PI会议
- 批准号:
0957954 - 财政年份:2009
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Putting the Clouds in Context: Statistical Machine Translation with MapReduce
将云放在上下文中:使用 MapReduce 进行统计机器翻译
- 批准号:
0836560 - 财政年份:2008
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
- 批准号:
10099896 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
- 批准号:
AH/X011747/1 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
- 批准号:
MR/Z503757/1 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
- 批准号:
BB/Y004426/1 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
- 批准号:
ST/Z000017/1 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
- 批准号:
2312089 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
- 批准号:
2317251 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
- 批准号:
2329908 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
- 批准号:
2331111 - 财政年份:2024
- 资助金额:
$ 49.97万 - 项目类别:
Standard Grant