CI-ADDO-EN: Collaborative Proposal: Supporting Web-Scale Experimentation Using the Lemur Toolkit

CI-ADDO-EN:协作提案:使用 Lemur 工具包支持网络规模实验

基本信息

  • 批准号:
    0934358
  • 负责人:
  • 金额:
    $ 53万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2010
  • 资助国家:
    美国
  • 起止时间:
    2010-06-01 至 2015-05-31
  • 项目状态:
    已结题

项目摘要

This project maintains and enhances existing community software infrastructure, and creates new community data infrastructure to enable the information retrieval research community and related research communities to conduct research on a "web scale", meaning datasets of a billion or more web pages together with large query logs. The software infrastructure is based on the Lemur Toolkit and the associated Indri search engine, which are used by many information retrieval researchers due to the support for multiple retrieval models, multiple forms of evidence, and a powerful probabilistic query language. The enhancements to Lemur include support for the popular MapReduce style of distributed processing and other efficiency improvements to make it practical to do research on large web datasets 'out of the box' in common computer hardware environments. The new data infrastructure consists of maintenance and distribution of a newly created billion-page dataset, another new web dataset, and large, anonymized search logs that match the datasets. The combination of large datasets and corresponding large search logs enable a broad community to conduct research with more realistic data resources than were available previously. This research will lead to further advances in the understanding of the underlying issues for large-scale, personalized search, which will be an important part of the next generation of search engines. For further information, see the project web site at the URL: http://www.lemurproject.org.
该项目维护和增强现有的社区软件基础设施,并创建新的社区数据基础设施,使信息检索研究社区和相关研究社区能够在“网络规模”上进行研究,即十亿或更多网页的数据集以及大型查询日志。软件基础设施基于Lemur Toolkit和相关的Indri搜索引擎,由于支持多种检索模型,多种形式的证据和强大的概率查询语言,许多信息检索研究人员都使用这些搜索引擎。Lemur的增强功能包括支持流行的MapReduce风格的分布式处理和其他效率改进,使其能够在常见的计算机硬件环境中对大型Web数据集进行“开箱即用”的研究。新的数据基础设施包括维护和分发新创建的十亿页数据集,另一个新的Web数据集以及与数据集匹配的大型匿名搜索日志。大型数据集和相应的大型搜索日志的组合使广泛的社区能够使用比以前更真实的数据资源进行研究。这项研究将导致对大规模个性化搜索的基本问题的进一步理解,这将是下一代搜索引擎的重要组成部分。欲了解更多信息,请访问项目网站,网址为:http://www.lemurproject.org。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Jamie Callan其他文献

Pruning long documents for distributed information retrieval
修剪长文档以进行分布式信息检索
  • DOI:
    10.1145/584792.584847
  • 发表时间:
    2002
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jie Lu;Jamie Callan
  • 通讯作者:
    Jamie Callan
Language processing technologies for electronic rulemaking: a project highlight
用于电子规则制定的语言处理技术:项目亮点
  • DOI:
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Stuart W. Shulman;E. Hovy;Jamie Callan;S. Zavestoski
  • 通讯作者:
    S. Zavestoski
Passage-retrieval evidence in document retrieval
  • DOI:
  • 发表时间:
    1994
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jamie Callan
  • 通讯作者:
    Jamie Callan
Metric-based ontology learning
基于度量的本体学习
  • DOI:
    10.1145/1458484.1458486
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    3
  • 作者:
    G. Yang;Jamie Callan
  • 通讯作者:
    Jamie Callan
An effective and efficient results merging strategy for multilingual information retrieval in federated search environments
联合搜索环境中多语言信息检索的有效且高效的结果合并策略
  • DOI:
    10.1007/s10791-007-9036-6
  • 发表时间:
    2007-11
  • 期刊:
  • 影响因子:
    2.8
  • 作者:
    Jamie Callan;Luo Si
  • 通讯作者:
    Luo Si

Jamie Callan的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Jamie Callan', 18)}}的其他基金

III: Small: Reliable and Generalizable Neural Search Engine Architectures
III:小:可靠且可推广的神经搜索引擎架构
  • 批准号:
    1815528
  • 财政年份:
    2018
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
CRI: CI-SUSTAIN: Collaborative Research: Sustaining Lemur Project Resources for the Long-Term
CRI:CI-SUSTAIN:合作研究:长期维持狐猴项目资源
  • 批准号:
    1822975
  • 财政年份:
    2018
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
III: Small: Using Knowledge Resources to Improve Information Retrieval
III:小:利用知识资源改进信息检索
  • 批准号:
    1422676
  • 财政年份:
    2014
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
CI-EN-Collaborative Research: Supporting Research and Teaching for Next-Generation Search Engines in Lemur
CI-EN-协作研究:支持狐猴下一代搜索引擎的研究和教学
  • 批准号:
    1405045
  • 财政年份:
    2014
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
III: Medium: Selective Search of Large-Scale Text Collections
III:媒介:大规模文本集合的选择性搜索
  • 批准号:
    1302206
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
III: Medium: Collaborative Research: Connecting the Ephemeral and Archival Information Networks
III:媒介:协作研究:连接临时和档案信息网络
  • 批准号:
    1160862
  • 财政年份:
    2012
  • 资助金额:
    $ 53万
  • 项目类别:
    Continuing Grant
III: Small: Modeling and Predicting Term Mismatch for Full-Text Retrieval
III:小:全文检索的术语不匹配建模和预测
  • 批准号:
    1018317
  • 财政年份:
    2010
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
DC: Small: An Integrated Architecture for Federated Search
DC:小型:联合搜索的集成架构
  • 批准号:
    0916553
  • 财政年份:
    2009
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
Preservation and Access for ClueWeb09 Image Data
ClueWeb09 图像数据的保存和访问
  • 批准号:
    0948856
  • 财政年份:
    2009
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
SGER: Multi-Tier Indexing for Web Search Engines
SGER:网络搜索引擎的多层索引
  • 批准号:
    0841275
  • 财政年份:
    2008
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant

相似海外基金

Collaborative Research: CI-ADDO-EN: Research Repository for Model-Driven Software Development (REMODD)
协作研究:CI-ADDO-EN:模型驱动软件开发研究存储库 (REMODD)
  • 批准号:
    1305381
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
Collaborative Research: CI-ADDO-EN: Making Internet Routing Data Accessible To All
合作研究:CI-ADDO-EN:让所有人都能访问互联网路由数据
  • 批准号:
    1305404
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: Collaborative Research: Enhancing the srcML Infrastructure: A Mixed-Language Exploration, Analysis, and Manipulation Framework to Support Software Evolution
CI-ADDO-EN:协作研究:增强 srcML 基础设施:支持软件演进的混合语言探索、分析和操作框架
  • 批准号:
    1305292
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
Collaborative Research: CI-ADDO-EN: Making Internet Routing Data Accessible To All
合作研究:CI-ADDO-EN:让所有人都能访问互联网路由数据
  • 批准号:
    1305218
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: Smart Home in a Box: Creating a Large Scale, Long Term Repository for Smart Environment Technologies
CI-ADDO-EN:盒子里的智能家居:为智能环境技术创建大规模、长期存储库
  • 批准号:
    1262814
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: Infrastructure for the RF-Powered Computing Community
CI-ADDO-EN:射频驱动计算社区的基础设施
  • 批准号:
    1305072
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
CRI-CI-ADDO-EN: National File System Trace Repository
CRI-CI-ADDO-EN:国家文件系统跟踪存储库
  • 批准号:
    1305360
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
Collaborative Research: CI-ADDO-EN: Research Repository for Model-Driven Software Development (REMODD)
协作研究:CI-ADDO-EN:模型驱动软件开发研究存储库 (REMODD)
  • 批准号:
    1305358
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
CI-ADDO-EN: Collaborative Research: Enhancing the srcML Infrastructure: A Mixed-Language Exploration, Analysis, and Manipulation Framework to Support Software Evolution
CI-ADDO-EN:协作研究:增强 srcML 基础设施:支持软件演进的混合语言探索、分析和操作框架
  • 批准号:
    1305217
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
Collaborative Research: CI-ADDO-EN: Making Internet Routing Data Accessible To All
合作研究:CI-ADDO-EN:让所有人都能访问互联网路由数据
  • 批准号:
    1305346
  • 财政年份:
    2013
  • 资助金额:
    $ 53万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了