III: Small: Efficiency Optimization for Neural Document Ranking with Compact Representations

III:小:具有紧凑表示的神经文档排序的效率优化

基本信息

  • 批准号:
    2225942
  • 负责人:
  • 金额:
    $ 59.37万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2022
  • 资助国家:
    美国
  • 起止时间:
    2022-09-01 至 2025-08-31
  • 项目状态:
    未结题

项目摘要

Over the last few years, the resurgence of neural models has greatly advanced the field of information retrieval enabling retrieval engines to effectively match and rank search results in response to a user query. For example, this new technology has enable to determine the most relevant documents in response to a query even when some query keywords may not appear in these documents. The main drawback of using deep neural models for ranking is that the retrieval is extremely time consuming. As a result, such models cannot be deployed in many practical search applications. This project is focused on studying efficient solutions to perform neural ranking computation and the developed techniques will be evaluated using public datasets to assess the solution’s effectiveness. The project integrates the research with an educational plan including undergraduate and graduate students' involvement, instructional material development, and outreach activities. This project carries out a two-thrust research agenda for efficient neural ranking. The first thrust investigates a fast re-ranking scheme for a dual-encoding architecture by leveraging precomputed embeddings to compose a query representation with approximation, and combining deep contextual token interactions and traditional lexical matching features. The second thrust of this project investigates a compact representation of document embeddings and strike a balance of relevance and space efficiency which affects online inference latency. The project exploits the composite nature of ranking inference for answering a query to approximate query embeddings, and decouples ranking contribution of document embeddings in deriving a compact representation. This research will advance our fundamental understanding of relevance and efficiency tradeoffs in neural information retrieval, and significantly reduce the computing and space cost of online inference while retaining the essential benefits of deep learning for effective ranking on affordable computing platforms.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在过去的几年里,神经模型的复兴极大地推进了信息检索领域,使检索引擎能够有效地匹配和排名搜索结果以响应用户查询。例如,这种新技术使得能够响应于查询来确定最相关的文档,即使某些查询关键字可能没有出现在这些文档中。 使用深度神经模型进行排名的主要缺点是检索非常耗时。因此,这样的模型不能部署在许多实际的搜索应用程序。 该项目的重点是研究执行神经排序计算的有效解决方案,并将使用公共数据集评估所开发的技术,以评估解决方案的有效性。该项目将研究与教育计划相结合,包括本科生和研究生的参与,教学材料的开发和推广活动。该项目针对高效神经排名实施了两个重点的研究议程。第一个推力研究了一个快速重新排序方案的双重编码架构,利用预先计算的嵌入组成的查询表示与近似,并结合深上下文令牌的相互作用和传统的词汇匹配功能。该项目的第二个重点是研究文档嵌入的紧凑表示,并在影响在线推理延迟的相关性和空间效率之间取得平衡。该项目利用排序推理的复合性质来回答近似查询嵌入的查询,并在导出紧凑表示时对文档嵌入的排序贡献进行简化。这项研究将促进我们对神经信息检索中相关性和效率权衡的基本理解,并显著降低在线推理的计算和空间成本,同时保留深度学习的基本优势,以便在负担得起的计算平台上进行有效排名。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响进行评估,被认为值得支持审查标准。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Representation Sparsification with Hybrid Thresholding for Fast SPLADE-based Document Retrieval
Optimizing Guided Traversal for Fast Learned Sparse Retrieval
  • DOI:
    10.1145/3543507.3583497
  • 发表时间:
    2023-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Yifan Qiao;Yingrui Yang;Haixin Lin;Tao Yang
  • 通讯作者:
    Yifan Qiao;Yingrui Yang;Haixin Lin;Tao Yang
Balanced Knowledge Distillation with Contrastive Learning for Document Re-ranking
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Tao Yang其他文献

High Resolution Spectroscopic Measurement of 130Te2: Reference Lines near 444.4 nm for eEDM Experiment using PbF molecules
130Te2 的高分辨率光谱测量:使用 PbF 分子进行 eEDM 实验的 444.4 nm 附近的参考线
A novel negative selection algorithm based on subspace clustering
一种基于子空间聚类的负选择算法
An Improved Preparation of 4-Chloro-1H-indazole
4-氯-1H-吲唑制备方法的改进
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ge Meng;Tao Yang;Yang Liu
  • 通讯作者:
    Yang Liu
Optimal short-term outcomes in balloon pulmonary angioplasty: the minimum frequency of three sessions annually
球囊肺血管成形术的最佳短期结果:每年至少进行 3 次治疗的频率
  • DOI:
    10.1177/17534666241232521
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    4.3
  • 作者:
    Xin Li;Tao Yang;Yi Zhang;Qing Zhao;Q. Zeng;Qi Jin;Anqi Duan;Zhi;Meixi Hu;Sicheng Zhang;Luyang Gao;Changming Xiong;Q. Luo;Zhihui Zhao;Zhihong Liu
  • 通讯作者:
    Zhihong Liu
Distributed least squares solver for network linear equations
网络线性方程的分布式最小二乘求解器
  • DOI:
    10.1016/j.automatica.2019.108798
  • 发表时间:
    2018-09
  • 期刊:
  • 影响因子:
    6.4
  • 作者:
    Tao Yang;Jemin George;Jiahu Qin;Xinlei Yi;Junfeng Wu
  • 通讯作者:
    Junfeng Wu

Tao Yang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Tao Yang', 18)}}的其他基金

EAGER: Efficient Privacy-aware Document Search in the Cloud
EAGER:云端高效的隐私意识文档搜索
  • 批准号:
    2040146
  • 财政年份:
    2020
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
III: Small: Low-Cost Deduplication and Search for Versioned Datasets
III:小型:低成本重复数据删除和版本化数据集搜索
  • 批准号:
    1528041
  • 财政年份:
    2015
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
III: Small: Parallel Similarity Comparison and Duplicate Detection with Incremental Computing
III:小:增量计算的并行相似性比较和重复检测
  • 批准号:
    1118106
  • 财政年份:
    2011
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
SOFTWARE:"Cluster-based Runtime Support for Data-Intensive Online Applications"
软件:“数据密集型在线应用程序基于集群的运行时支持”
  • 批准号:
    0234346
  • 财政年份:
    2003
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Continuing Grant
ITR: Optimizing Execution of Parallel Programs on a Cluster of Shared Memory Machines
ITR:优化共享内存机器集群上并行程序的执行
  • 批准号:
    0082666
  • 财政年份:
    2000
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
CAREER: Scheduling and Run-time Support for Parallel Irregular Computations
职业:并行不规则计算的调度和运行时支持
  • 批准号:
    9702640
  • 财政年份:
    1997
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Continuing Grant
U.S.-France Cooperative Research: Parameterized Task Graph Scheduling
美法合作研究:参数化任务图调度
  • 批准号:
    9513361
  • 财政年份:
    1996
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
Research Initiation Award: Scheduling Task and Loop Parallelism on Message-Passing Architectures
研究启动奖:消息传递架构上的调度任务和循环并行性
  • 批准号:
    9409695
  • 财政年份:
    1994
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

CSR: Small: Enhancing Timeliness and Power-Efficiency of Real-Time Data Services
CSR:小:提高实时数据服务的及时性和能效
  • 批准号:
    2326796
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
III: Small: 3D Graph Neural Networks: Completeness, Efficiency, and Applications
III:小:3D 图神经网络:完整性、效率和应用
  • 批准号:
    2243850
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
CIF: Small: Efficiency and Robustness of Secure Computation
CIF:小:安全计算的效率和稳健性
  • 批准号:
    2327981
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
III: Small: A Big Data and Machine Learning Approach for Improving the Efficiency of Two-sided Online Labor Markets
III:小:提高双边在线劳动力市场效率的大数据和机器学习方法
  • 批准号:
    2311582
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
An assessment of the ability of cargo buses to improve the efficiency of small businesses' logistics, reduce carbon emissions from transport, and impr
评估货运巴士提高小型企业物流效率、减少运输碳排放以及改善小型企业物流效率的能力
  • 批准号:
    2885543
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Studentship
SHF: Small: Improving Efficiency of Vision Transformers via Software-Hardware Co-Design and Acceleration
SHF:小型:通过软硬件协同设计和加速提高视觉变压器的效率
  • 批准号:
    2233893
  • 财政年份:
    2023
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
Development of high efficiency, small footprint, and low cost UV laser technology
开发高效率、小占地面积、低成本的紫外激光技术
  • 批准号:
    566550-2021
  • 财政年份:
    2022
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Alliance Grants
CIF: Small: Foundations of Decentralized Data Science: Optimizing Utility, Privacy and Communication Efficiency
CIF:小型:去中心化数据科学的基础:优化实用性、隐私和通信效率
  • 批准号:
    2213223
  • 财政年份:
    2022
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
CNS Core: Small: Leveraging Hardware Counters to Improve the Performance and Energy Efficiency of Mobile Apps
CNS 核心:小型:利用硬件计数器提高移动应用程序的性能和能源效率
  • 批准号:
    2149533
  • 财政年份:
    2022
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
Collaborative Research: CPS: Small: Co-Design of Prediction and Control across Data Boundaries: Efficiency, Privacy, and Markets
协作研究:CPS:小型:跨数据边界的预测和控制的协同设计:效率、隐私和市场
  • 批准号:
    2133403
  • 财政年份:
    2021
  • 资助金额:
    $ 59.37万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了