EAGER: Learning to Efficiently Rank with Cascades
EAGER:学习使用级联进行有效排名
基本信息
- 批准号:1144034
- 负责人:
- 金额:$ 15万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2011
- 资助国家:美国
- 起止时间:2011-09-01 至 2014-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Text search is undeniably vital to today's information-based societies, helping users locate relevant information in web pages, journal articles, news stories, blogs, emails, tweets, and a myriad of other sources. Naturally, users desire results that are not only good but also fast. Learning to rank, the dominant approach to information retrieval (IR) today, focuses almost exclusively on effectiveness, often neglecting the runtime speed (i.e., efficiency) of the ranking functions. This project contributes to the emerging research area of learning to efficiently rank, which aims to let algorithm designers capture, model, and reason about tradeoffs between effectiveness and efficiency in a unified framework. Specifically, this project explores a novel cascade model for retrieval, where ranking is broken into a finite number of distinct stages. Each stage considers successively richer and more complex features, but over successively smaller candidate document sets. The intuition is that although complex features are more time-consuming to compute, examining fewer documents offsets the additional overhead. In other words, the cascade model views retrieval as a multi-stage progressive refinement problem. Based on the survey of the current state-of-the-art, knowledge, this is the first project to explore this approach to the ranking problem, marking a substantial departure from previous "monolithic" ranking functions. Although exploration in this uncharted area carries some risk, this research promises to open up a new frontier in IR research. This project aims to narrow the chasm between academic and industrial IR research by bringing together theoretical IR research and practical considerations in "real-world" search. It is expected that the cascade model will be of interest to web search engine companies, thus providing a path from the exploratory research results to significant impact in production systems. Furthermore, this work dovetails with the emerging area of green computing: more efficient algorithms use less energy, hence help reduce the environmental footprint of web-scale services. The project web site (http://www.umiacs.umd.edu/~jimmylin/projects/) includes more information about this project and will be used for the release of a prototype as part of the Ivory open-source retrieval toolkit.
不可否认,文本搜索对当今的信息社会至关重要,它可以帮助用户在网页、期刊文章、新闻故事、博客、电子邮件、推特和无数其他来源中查找相关信息。当然,用户希望得到的结果不仅好而且快。学习排序是当今信息检索(IR)的主要方法,几乎只关注有效性,往往忽略了排序函数的运行速度(即效率)。这个项目对学习有效排名这一新兴研究领域做出了贡献,旨在让算法设计人员在一个统一的框架中捕获、建模和推理关于有效性和效率之间的权衡。具体地说,这个项目探索了一种新的级联检索模型,其中排名被分解为有限数量的不同阶段。每个阶段考虑的特征依次更丰富、更复杂,但考虑的候选文档集却相对较小。人们的直觉是,尽管复杂的功能计算起来更耗时,但检查较少的文档可以抵消额外的开销。换句话说,级联模型将检索视为一个多阶段渐进求精问题。基于对目前最先进的知识的调查,这是第一个探索这种方法来解决排名问题的项目,标志着与以前的“铁板一块”的排名函数有很大的不同。尽管在这一未知领域的探索存在一些风险,但这项研究有望为IR研究开辟一个新的前沿。该项目旨在通过将理论IR研究和现实世界搜索中的实际考虑结合在一起,缩小学术IR研究和行业IR研究之间的鸿沟。预计级联模型将引起网络搜索引擎公司的兴趣,从而提供一条从探索性研究成果到对生产系统产生重大影响的途径。此外,这项工作与新兴的绿色计算领域相吻合:更高效的算法使用更少的能源,从而有助于减少网络规模服务的环境足迹。项目网站(http://www.umiacs.umd.edu/~jimmylin/projects/)载有关于该项目的更多信息,并将用于发布一个原型,作为象牙开放源码检索工具包的一部分。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jimmy Lin其他文献
PartsList: a web-based system for dynamically ranking protein folds based on disparate attributes, including whole-genome expression and interaction information.
PartsList:一个基于网络的系统,用于根据不同的属性(包括全基因组表达和相互作用信息)对蛋白质折叠进行动态排名。
- DOI:
- 发表时间:
2001 - 期刊:
- 影响因子:14.9
- 作者:
Jiang Qian;Brad Stenger;Cyrus A. Wilson;Jimmy Lin;R. Jansen;S. Teichmann;Jong H. Park;W. G. Krebs;Haiyuan Yu;Vadim Alexandrov;N. Echols;M. Gerstein - 通讯作者:
M. Gerstein
Sensornet
传感器网
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Rodney Topor;Kenneth Salem;Amarnath Gupta;K. Goda;John F. Gehrke;N. Palmer;Mohamed Sharaf;Alexandros Labrinidis;J. Roddick;Ariel Fuxman;Renée J. Miller;Wang;Anastasios Kementsietsidis;Philippe Bonnet;D. Shasha;Ronald Peikert;Bertram Ludäscher;S. Bowers;T. McPhillips;Harald Naumann;K. Voruganti;J. Domingo;Ben Carterette;Panagiotis G. Ipeirotis;Marcelo Arenas;Y. Manolopoulos;Y. Theodoridis;V. Tsotras;B. Carminati;Jan Jurjens;Eduardo B. Fernandez;Murat Kantarcıoǧlu;Jaideep Vaidya;Indrakshi Ray;Athena Vakali;Cristina Sirangelo;E. Pitoura;Himanshu Gupta;Surajit Chaudhuri;G. Weikum;Ulf Leser;David W. Embley;Fausto Giunchiglia;P. Shvaiko;Mikalai Yatskevich;Edward Y. Chang;Christine Parent;S. Spaccapietra;E. Zimányi;G. Anadiotis;S. Kotoulas;Ronny Siebes;Grigoris Antoniou;D. Plexousakis;J. Bailey;François Bry;Tim Furche;Sebastian Schaffert;David Martin;Gregory D. Speegle;Krithi Ramamritham;P. Chrysanthis;Kai;Stéphane Bressan;S. Abiteboul;D. Suciu;G. Dobbie;Tok Wang Ling;Sugato Basu;Ramesh Govindan;Michael H. Böhlen;C. S. Jensen;Jianyong Wang;K. Vidyasankar;A. Chan;Serge Mankovski;S. Elnikety;P. Valduriez;Yannis Velegrakis;Mario A. Nascimento;Michael Huggett;Andrew U. Frank;Yanchun Zhang;Guandong Xu;R. Snodgrass;Alan Fekete;Marcus Herzog;Konstantinos Morfonios;Y. Ioannidis;E. Wohlstadter;M. Matera;F. Schwagereit;Steffen Staab;Keir Fraser;Jingren Zhou;M. Mokbel;Walid G. Aref;Mirella M. Moro;Markus Schneider;Panos Kalnis;Gabriel Ghinita;Michael F. Goodchild;Shashi Shekhar;James Kang;Vijayaprasath Gandhi;Nikos Mamoulis;Betsy George;Michel Scholl;Agnès Voisard;Ralf Hartmut Güting;Yufei Tao;Dimitris Papadias;Peter Revesz;G. Kollios;E. Frentzos;Apostolos N. Papadopoulos;Bernhard Thalheim;Jovan Pehcevski;Benjamin Piwowarski;S. Theodoridis;Konstantinos Koutroumbas;George Karabatis;Don Chamberlin;Philip A. Bernstein;Michael H. Böhlen;J. Gamper;Ping Li;Kazimierz Subieta;S. Harizopoulos;Ethan Zhang;Yi Zhang;Theodore Johnson;Hans;S. Fienberg;Jiashun Jin;Radu Sion;C. Paice;Nikos Hardavellas;Ippokratis Pandis;Edie M. Rasmussen;Hiroshi Yoshida;G. Graefe;Bernd Reiner;Karl Hahn;K. Wada;T. Risch;Jiawei Han;Bolin Ding;Lukasz Golab;Michael Stonebraker;Bibudh Lahiri;Srikanta Tirthapura;Erik Vee;Yanif Ahmad;U. Çetintemel;Mitch Cherniack;S. Zdonik;Mariano P. Consens;M. Lalmas;R. Baeza;D. Hiemstra;Peer Krögerand;Arthur Zimek;Nick Craswell;Carson Kai;Maxime Crochemore;Thierry Lecroq;Arie Shoshani;Jimmy Lin;Hwanjo Yu;David B. Lomet;H. Hinterberger;Ninghui Li;Phillip B. Gibbons;Mouna Kacimi;Thomas Neumann - 通讯作者:
Thomas Neumann
The Maryland Modular Method: An Approach to Doctoral Education in Information Studies
马里兰模块化方法:信息研究博士教育的一种方法
- DOI:
- 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
A. Druin;P. Jaeger;J. Golbeck;K. Fleischmann;Jimmy Lin;Yan Qu;Ping Wang;Bo Xie - 通讯作者:
Bo Xie
Resources for Brewing BEIR: Reproducible Reference Models and Statistical Analyses
酿造 BEIR 的资源:可重复的参考模型和统计分析
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
Ehsan Kamalloo;Nandan Thakur;Carlos Lassance;Jimmy Lin - 通讯作者:
Jimmy Lin
SmartProbe: A Virtual Moderator for Market Research Surveys
SmartProbe:市场研究调查的虚拟主持人
- DOI:
10.48550/arxiv.2305.08271 - 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Joshua Seltzer;Jia;Kathy Cheng;Yuxiao Sun;Santosh Kolagati;Jimmy Lin;Shi Zong - 通讯作者:
Shi Zong
Jimmy Lin的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jimmy Lin', 18)}}的其他基金
Student Travel Support for the 2014 IEEE International Conference on Big Data
2014 年 IEEE 国际大数据会议学生旅行支持
- 批准号:
1444666 - 财政年份:2014
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
II-EN: Hadoop NextGen Infrastructure for Heterogeneous Approaches to Data-Intensive Computing
II-EN:用于数据密集型计算异构方法的 Hadoop NextGen 基础设施
- 批准号:
1405688 - 财政年份:2014
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
III: Small: Providing Relevant and Timely Results: Real-Time Search Architectures and Relevance Algorithms
III:小型:提供相关且及时的结果:实时搜索架构和相关性算法
- 批准号:
1218043 - 财政年份:2012
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
DC: Small: Cross-Language Bayesian Models for Web-Scale Text Analysis Using MapReduce
DC:小型:使用 MapReduce 进行 Web 规模文本分析的跨语言贝叶斯模型
- 批准号:
1018625 - 财政年份:2010
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
III: Small: Ivory -- A Hadoop Toolkit for Distributed Text Retrieval
III:小:Ivory——分布式文本检索的 Hadoop 工具包
- 批准号:
0916043 - 财政年份:2009
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
2009 PI Meeting for the Cluster Exploratory Program
2009年集群探索计划PI会议
- 批准号:
0957954 - 财政年份:2009
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
Putting the Clouds in Context: Statistical Machine Translation with MapReduce
将云放在上下文中:使用 MapReduce 进行统计机器翻译
- 批准号:
0836560 - 财政年份:2008
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Understanding structural evolution of galaxies with machine learning
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
煤矿安全人机混合群智感知任务的约束动态多目标Q-learning进化分配
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
基于领弹失效考量的智能弹药编队短时在线Q-learning协同控制机理
- 批准号:62003314
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
集成上下文张量分解的e-learning资源推荐方法研究
- 批准号:61902016
- 批准年份:2019
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
具有时序迁移能力的Spiking-Transfer learning (脉冲-迁移学习)方法研究
- 批准号:61806040
- 批准年份:2018
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
基于Deep-learning的三江源区冰川监测动态识别技术研究
- 批准号:51769027
- 批准年份:2017
- 资助金额:38.0 万元
- 项目类别:地区科学基金项目
具有时序处理能力的Spiking-Deep Learning(脉冲深度学习)方法研究
- 批准号:61573081
- 批准年份:2015
- 资助金额:64.0 万元
- 项目类别:面上项目
基于有向超图的大型个性化e-learning学习过程模型的自动生成与优化
- 批准号:61572533
- 批准年份:2015
- 资助金额:66.0 万元
- 项目类别:面上项目
E-Learning中学习者情感补偿方法的研究
- 批准号:61402392
- 批准年份:2014
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Collaborative Research: NSF-BSF: SaTC: CORE: Small: Detecting malware with machine learning models efficiently and reliably
协作研究:NSF-BSF:SaTC:核心:小型:利用机器学习模型高效可靠地检测恶意软件
- 批准号:
2338301 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Continuing Grant
Collaborative Research: NSF-BSF: SaTC: CORE: Small: Detecting malware with machine learning models efficiently and reliably
协作研究:NSF-BSF:SaTC:核心:小型:利用机器学习模型高效可靠地检测恶意软件
- 批准号:
2338302 - 财政年份:2024
- 资助金额:
$ 15万 - 项目类别:
Continuing Grant
Towards AI that is forever learning efficiently
迈向永远高效学习的人工智能
- 批准号:
2740621 - 财政年份:2022
- 资助金额:
$ 15万 - 项目类别:
Studentship
SaTC: CORE: Small: LESS DOUBT: Learning Efficiently form Statistical Samples-Demonstrating Outcomes Using Better Tests
SaTC:核心:小:更少怀疑:从统计样本中有效学习 - 使用更好的测试展示结果
- 批准号:
2228884 - 财政年份:2022
- 资助金额:
$ 15万 - 项目类别:
Continuing Grant
Learning Automata Efficiently
高效学习自动机
- 批准号:
505138-2017 - 财政年份:2020
- 资助金额:
$ 15万 - 项目类别:
Postgraduate Scholarships - Doctoral
CNS Core: Small: Moving Machine Learning into the Next-Generation Cloud Flexibly, Agilely and Efficiently
CNS核心:小:灵活、敏捷、高效地将机器学习迁移到下一代云
- 批准号:
2008265 - 财政年份:2020
- 资助金额:
$ 15万 - 项目类别:
Standard Grant
Learning Automata Efficiently
高效学习自动机
- 批准号:
505138-2017 - 财政年份:2019
- 资助金额:
$ 15万 - 项目类别:
Postgraduate Scholarships - Doctoral
Efficiently tuning quantum devices using machine learning
使用机器学习有效调整量子设备
- 批准号:
2268392 - 财政年份:2019
- 资助金额:
$ 15万 - 项目类别:
Studentship
Learning to Efficiently Plan in Flexible Distributed Organizations
学习在灵活的分布式组织中进行有效规划
- 批准号:
EP/R001227/2 - 财政年份:2018
- 资助金额:
$ 15万 - 项目类别:
Research Grant
Learning Automata Efficiently
高效学习自动机
- 批准号:
505138-2017 - 财政年份:2018
- 资助金额:
$ 15万 - 项目类别:
Postgraduate Scholarships - Doctoral