CI-ADDO-EN: Collaborative Proposal: Supporting Web-Scale Experimentation using the Lemur Toolkit
CI-ADDO-EN:协作提案:使用 Lemur 工具包支持网络规模实验
基本信息
- 批准号:0934322
- 负责人:
- 金额:$ 53万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2010
- 资助国家:美国
- 起止时间:2010-06-01 至 2016-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project maintains and enhances existing community softwareinfrastructure, and creates new community data infrastructure toenable the information retrieval research community and relatedresearch communities to conduct research on a "web scale",meaning datasets of a billion or more web pages together withlarge query logs. The software infrastructure is based on theLemur Toolkit and the associated Indri search engine, which areused by many information retrieval researchers due to the supportfor multiple retrieval models, multiple forms of evidence, and apowerful probabilistic query language. The enhancements to Lemurinclude support for the popular MapReduce style of distributedprocessing and other efficiency improvements to make it practicalto do research on large web datasets 'out of the box' in commoncomputer hardware environments.The new data infrastructure consists of maintenance anddistribution of a newly created billion-page dataset, another newweb dataset, and large, anonymized search logs that match thedatasets. The combination of large datasets and correspondinglarge search logs enable a broad community to conduct researchwith more realistic data resources than were availablepreviously. This research will lead to further advances in theunderstanding of the underlying issues for large-scale,personalized search, which will be an important part of the nextgeneration of search engines.For further information, see the project web site at the URL:http://www.lemurproject.org.
该项目维护和增强现有的社区软件基础设施,并创建新的社区数据基础设施,使信息检索研究社区和相关研究社区能够在“网络规模”上进行研究,这意味着十亿或更多网页的数据集以及大型查询日志。软件基础设施基于Lemur Toolkit和相关的Indri搜索引擎,由于支持多种检索模型,多种形式的证据和强大的概率查询语言,许多信息检索研究人员都在使用它们。Lemur的增强功能包括支持流行的MapReduce分布式处理风格和其他效率改进,使其能够在普通计算机硬件环境中对大型Web数据集进行“开箱即用”的研究。新的数据基础设施包括维护和分发一个新创建的十亿页数据集,另一个新的Web数据集,以及与数据集匹配的大型匿名搜索日志。大型数据集和相应的大型搜索日志的组合使广泛的社区能够使用比以前更真实的数据资源进行研究。这项研究将导致对大规模个性化搜索的基本问题的进一步理解,这将是下一代搜索引擎的重要组成部分。http://www.lemurproject.org
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
W. Bruce Croft其他文献
Clustering large files of documents using the single-link method
- DOI:
10.1002/asi.4630280606 - 发表时间:
1977-11 - 期刊:
- 影响因子:0
- 作者:
W. Bruce Croft - 通讯作者:
W. Bruce Croft
The Darwinization of Linguistics
语言学的达尔文化
- DOI:
10.1556/select.3.2002.1.7 - 发表时间:
2002 - 期刊:
- 影响因子:0
- 作者:
W. Bruce Croft - 通讯作者:
W. Bruce Croft
Methods for Finding Language Universals in Syntax
在语法中查找语言共性的方法
- DOI:
10.1007/978-1-4020-8825-4_8 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
W. Bruce Croft - 通讯作者:
W. Bruce Croft
The Speech Community in Evolutionary Language Dynamics
进化语言动力学中的语音群落
- DOI:
10.1111/j.1467-9922.2009.00535.x - 发表时间:
2009 - 期刊:
- 影响因子:4.4
- 作者:
R. Blythe;W. Bruce Croft - 通讯作者:
W. Bruce Croft
Two-stage query segmentation for information retrieval
用于信息检索的两阶段查询分段
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Michael Bendersky;W. Bruce Croft;David A. Smith - 通讯作者:
David A. Smith
W. Bruce Croft的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('W. Bruce Croft', 18)}}的其他基金
III: Small: Searching for Answers through Iterative Feedback
III:小:通过迭代反馈寻找答案
- 批准号:
1715095 - 财政年份:2017
- 资助金额:
$ 53万 - 项目类别:
Continuing Grant
CI-EN-Collaborative Research: Supporting Research and Teaching for Next-Generation Search Engines in Lemur
CI-EN-协作研究:支持狐猴下一代搜索引擎的研究和教学
- 批准号:
1405829 - 财政年份:2014
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
III: Small: Understanding the Relevance of Text Passages
III:小:理解文本段落的相关性
- 批准号:
1419693 - 财政年份:2014
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
III: Medium: Collaborative Research: Connecting the Ephemeral and Archival Information Networks
III:媒介:协作研究:连接临时和档案信息网络
- 批准号:
1160894 - 财政年份:2012
- 资助金额:
$ 53万 - 项目类别:
Continuing Grant
III-COR: Searching Archives of Community Knowledge
III-COR:搜索社区知识档案
- 批准号:
0711348 - 财政年份:2007
- 资助金额:
$ 53万 - 项目类别:
Continuing Grant
CRI: CRD - Supporting User Data, Privacy, and Evaluation in the Lemur Toolkit
CRI:CRD - 在 Lemur 工具包中支持用户数据、隐私和评估
- 批准号:
0707801 - 财政年份:2007
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
SGER: Breaking the Keyword Bottleneck: Towards More Effective Access of Government Information
SGER:打破关键词瓶颈:更有效地获取政府信息
- 批准号:
0527159 - 财政年份:2005
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
Question Triage for Experts and Documents: Expanding the Information Retrieval Function of the NSDL
专家和文献的问题分类:扩展 NSDL 的信息检索功能
- 批准号:
0226144 - 财政年份:2002
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
相似海外基金
Collaborative Research: CI-ADDO-EN: Research Repository for Model-Driven Software Development (REMODD)
协作研究:CI-ADDO-EN:模型驱动软件开发研究存储库 (REMODD)
- 批准号:
1305381 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
Collaborative Research: CI-ADDO-EN: Making Internet Routing Data Accessible To All
合作研究:CI-ADDO-EN:让所有人都能访问互联网路由数据
- 批准号:
1305404 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
CI-ADDO-EN: Collaborative Research: Enhancing the srcML Infrastructure: A Mixed-Language Exploration, Analysis, and Manipulation Framework to Support Software Evolution
CI-ADDO-EN:协作研究:增强 srcML 基础设施:支持软件演进的混合语言探索、分析和操作框架
- 批准号:
1305292 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
Collaborative Research: CI-ADDO-EN: Making Internet Routing Data Accessible To All
合作研究:CI-ADDO-EN:让所有人都能访问互联网路由数据
- 批准号:
1305218 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
CI-ADDO-EN: Smart Home in a Box: Creating a Large Scale, Long Term Repository for Smart Environment Technologies
CI-ADDO-EN:盒子里的智能家居:为智能环境技术创建大规模、长期存储库
- 批准号:
1262814 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
CI-ADDO-EN: Infrastructure for the RF-Powered Computing Community
CI-ADDO-EN:射频驱动计算社区的基础设施
- 批准号:
1305072 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
CRI-CI-ADDO-EN: National File System Trace Repository
CRI-CI-ADDO-EN:国家文件系统跟踪存储库
- 批准号:
1305360 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
Collaborative Research: CI-ADDO-EN: Research Repository for Model-Driven Software Development (REMODD)
协作研究:CI-ADDO-EN:模型驱动软件开发研究存储库 (REMODD)
- 批准号:
1305358 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
CI-ADDO-EN: Collaborative Research: Enhancing the srcML Infrastructure: A Mixed-Language Exploration, Analysis, and Manipulation Framework to Support Software Evolution
CI-ADDO-EN:协作研究:增强 srcML 基础设施:支持软件演进的混合语言探索、分析和操作框架
- 批准号:
1305217 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant
Collaborative Research: CI-ADDO-EN: Making Internet Routing Data Accessible To All
合作研究:CI-ADDO-EN:让所有人都能访问互联网路由数据
- 批准号:
1305346 - 财政年份:2013
- 资助金额:
$ 53万 - 项目类别:
Standard Grant