III: Small: Efficient Query Processing in Large Search Engines

III:小型:大型搜索引擎中的高效查询处理

基本信息

  • 批准号:
    1117829
  • 负责人:
  • 金额:
    $ 49.99万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-08-15 至 2015-07-31
  • 项目状态:
    已结题

项目摘要

The largest web search engines now receive hundreds of millions of queries per day that need to be answered in fractions of a second on collections of tens of billions of web documents. In order to process all these queries, search engines consume increasing amounts of hardware and energy resources. This project focuses on developing new algorithms, index structures, and other software techniques for scaling query processing in search engines, that is, techniques that allow queries to be executed faster and on larger data sets using fewer hardware and energy resources. Research activities in this project focus on three main approaches. First, the project studies how index size and access time can be reduced through improved index compression techniques. Second, work on new early termination techniques considers how the top results for a query can be computed without exhaustive traversal of the index structures for the query terms, for simple ranking functions such as BM25 or Cosine, and for the more complex functions with many features used by current web search engines. Finally, the project explores general techniques for query optimization in information retrieval (IR) systems, inspired by the significant body of work on query optimizers in database systems. Web search engines are a multi-billion dollar industry and a crucial component of the internet. Techniques resulting from this project are expected to benefit this industry by reducing the hardware cost and energy consumption of large-scale search services. Results will be disseminated through publications in major conferences and journals, tutorials at conferences, distribution of software libraries, contributions to existing software tools such as Lucene. This project provides research and educational opportunities for graduate and undergraduate students and prepare them for later work at companies, research labs, or universities. Web site (http://cis.poly.edu/westlab/queryproc/) provides more information about this project.
最大的网络搜索引擎现在每天接收数亿个查询,这些查询需要在几分之一秒内回答数百亿个网络文档的集合。为了处理所有这些查询,搜索引擎消耗了越来越多的硬件和能源资源。该项目专注于开发新的算法、索引结构和其他软件技术,用于扩展搜索引擎中的查询处理,即使用更少的硬件和能源在更大的数据集上更快地执行查询的技术。该项目的研究活动集中在三个主要方法上。首先,该项目研究如何通过改进的索引压缩技术来减少索引大小和访问时间。其次,新的提前终止技术的工作考虑了如何在不穷尽遍历查询项的索引结构的情况下计算查询的最高结果,对于诸如BM25或CoSine的简单排名函数,以及对于当前网络搜索引擎使用的具有许多特征的更复杂的函数。最后,该项目探索了信息检索(IR)系统中查询优化的一般技术,灵感来自于数据库系统中查询优化器的大量工作。网络搜索引擎是一个价值数十亿美元的行业,也是互联网的重要组成部分。该项目产生的技术有望通过降低大规模搜索服务的硬件成本和能源消耗而使该行业受益。结果将通过在主要会议和期刊上发表的出版物、会议上的教程、软件库的分发、对Lucene等现有软件工具的贡献来传播。该项目为研究生和本科生提供研究和教育机会,并为他们将来在公司、研究实验室或大学工作做好准备。网站(http://cis.poly.edu/westlab/queryproc/)提供了有关此项目的更多信息。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Torsten Suel其他文献

Permutation Routing and Sorting on Meshes with Row and Column Buses
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Torsten Suel
  • 通讯作者:
    Torsten Suel
On Randomized and Deterministic Schemes for Routing and Sorting on Fixed-Connection Networks
  • DOI:
    10.1007/3-540-64359-1_711
  • 发表时间:
    1998-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Torsten Suel
  • 通讯作者:
    Torsten Suel
Approximate maximum weight branchings
近似最大重量分支
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0.5
  • 作者:
    A. Bagchi;A. Bhargava;Torsten Suel
  • 通讯作者:
    Torsten Suel
Lower Bounds for Shellsort
希尔排序的下界
  • DOI:
    10.1006/jagm.1996.0825
  • 发表时间:
    1997
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Greg Plaxton;Torsten Suel;Greg Plaxton
  • 通讯作者:
    Greg Plaxton
Towards an Open and Highly Distributed Web Information Retrieval Architecture
走向开放和高度分布式的Web信息检索架构
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Torsten Suel;Chandana Mathur;Jo;Jiangong Zhang;A. Delis;M. Kharrazi;Xiaohui Long;K. Shanmugasundaram
  • 通讯作者:
    K. Shanmugasundaram

Torsten Suel的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Torsten Suel', 18)}}的其他基金

III: Small: Index Sharding and Query Routing in Distributed Search Engines
III:小:分布式搜索引擎中的索引分片和查询路由
  • 批准号:
    1718680
  • 财政年份:
    2017
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Continuing Grant
CAREER: Algorithmic Techniques for Massive Data Sets
职业:海量数据集的算法技术
  • 批准号:
    0093400
  • 财政年份:
    2001
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Continuing grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311596
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311598
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
  • 批准号:
    2311597
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: A New Machine Learning Paradigm Towards Effective yet Efficient Foundation Graph Learning Models
III:小型:一种新的机器学习范式,实现有效且高效的基础图学习模型
  • 批准号:
    2321504
  • 财政年份:
    2023
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Cost-Efficient Sampling and Estimation from Large-Scale Networks
III:小型:协作研究:大规模网络的经济高效采样和估计
  • 批准号:
    2209921
  • 财政年份:
    2021
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Cost-Efficient Sampling and Estimation from Large-Scale Networks
III:小型:协作研究:大规模网络的经济高效采样和估计
  • 批准号:
    1908375
  • 财政年份:
    2019
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Cost-Efficient Sampling and Estimation from Large-Scale Networks
III:小型:协作研究:大规模网络的经济高效采样和估计
  • 批准号:
    1910749
  • 财政年份:
    2019
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: A Scalable and Efficient Optical Map Assembler
III:小型:协作研究:可扩展且高效的光学地图组装器
  • 批准号:
    1618814
  • 财政年份:
    2016
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: Fast and Efficient Algorithms for Matrix Decompositions and Applications to Human Genetics
III:小:快速高效的矩阵分解算法及其在人类遗传学中的应用
  • 批准号:
    1661756
  • 财政年份:
    2016
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
III: Small: RUI: Efficient Search, Comparison, and Annotation for Biological Sequences
III:小:RUI:生物序列的高效搜索、比较和注释
  • 批准号:
    1528027
  • 财政年份:
    2015
  • 资助金额:
    $ 49.99万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了