Deep information retrieval - diving into information granularity and abstraction

深度信息检索——深入信息粒度和抽象

基本信息

  • 批准号:
    RGPIN-2018-05774
  • 负责人:
  • 金额:
    $ 6.99万
  • 依托单位:
  • 依托单位国家:
    加拿大
  • 项目类别:
    Discovery Grants Program - Individual
  • 财政年份:
    2022
  • 资助国家:
    加拿大
  • 起止时间:
    2022-01-01 至 2023-12-31
  • 项目状态:
    已结题

项目摘要

Although the final goal of information retrieval (IR) is to find relevant (pieces of) information, the research in IR has been generally limited to retrieving entire documents. In practice, many user queries are intended to find more precise segments of texts within documents. The first problem we deal with in this research is to make it possible for end users to find answers of different levels of granularity.IR also uses a unique representation for a document. In practice, user's search intents vary greatly: a query may be used to find a text containing a specific sequence of words, or a text containing the required semantics. The unique representation is unable to satisfy such various search intents. We propose to represent texts at different levels of abstraction, from surface words to more abstract semantic representations. Queries with different intents could then be compared with text representations at appropriate levels of abstraction.Finally, IR needs a complex ranking function, which is usually learned from ranking examples (learning-to-rank). However, the learning-to-rank approaches have never been used in combination with learning representations. We propose to combine the two learning tasks that are required. In addition, the matching function may also involve the use of domain knowledge to infer the semantic relations between a document and a query.The above problems will be investigated using deep learning techniques. Neural network representations for texts will be created at several layers, corresponding to different levels of abstraction. In addition, both the entire document and the searchable segments in it are represented. The learning-to-rank method will be trained to select the appropriate way to use the representations created in the network to rank documents for a query.The ultimate goal of this research is to develop more intelligent IR systems that can understand and cope with various user information needs.
虽然信息检索的最终目标是找到相关的信息,但信息检索的研究通常仅限于检索整个文档。在实践中,许多用户查询的目的是在文档中找到更精确的文本段。在这项研究中,我们处理的第一个问题是使最终用户能够找到不同粒度级别的答案。IR也使用了一个独特的表示文档。实际上,用户的搜索意图差异很大:查询可能用于查找包含特定单词序列的文本,或包含所需语义的文本。唯一表示无法满足这样的各种搜索意图。我们建议在不同的抽象层次上表示文本,从表面词到更抽象的语义表示。最后,IR需要一个复杂的排名功能,这通常是从排名示例(learning-to-rank)中学习的。然而,学习排名的方法从来没有与学习表示结合使用。我们建议将所需的两个学习任务联合收割机结合起来。此外,匹配功能还可能涉及使用领域知识来推断文档和查询之间的语义关系。上述问题将使用深度学习技术进行研究。文本的神经网络表示将在多个层次上创建,对应于不同的抽象层次。此外,整个文档和其中的可搜索段都被表示。学习排名的方法将被训练,以选择适当的方式来使用网络中创建的表示来排名文档的query.The最终目标是开发更智能的IR系统,可以理解和科普各种用户的信息需求。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Nie, JianYun其他文献

Nie, JianYun的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Nie, JianYun', 18)}}的其他基金

Deep information retrieval - diving into information granularity and abstraction
深度信息检索——深入信息粒度和抽象
  • 批准号:
    RGPIN-2018-05774
  • 财政年份:
    2021
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Computing servers for NLP applications
NLP应用的计算服务器
  • 批准号:
    RTI-2022-00466
  • 财政年份:
    2021
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Research Tools and Instruments
Deep information retrieval - diving into information granularity and abstraction
深度信息检索——深入信息粒度和抽象
  • 批准号:
    RGPIN-2018-05774
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Deep information retrieval - diving into information granularity and abstraction
深度信息检索——深入信息粒度和抽象
  • 批准号:
    RGPIN-2018-05774
  • 财政年份:
    2019
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Deep information retrieval - diving into information granularity and abstraction
深度信息检索——深入信息粒度和抽象
  • 批准号:
    RGPIN-2018-05774
  • 财政年份:
    2018
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Search intelligence as users expect
用户期望的搜索智能
  • 批准号:
    121418-2013
  • 财政年份:
    2017
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Search intelligence as users expect
用户期望的搜索智能
  • 批准号:
    121418-2013
  • 财政年份:
    2016
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Search intelligence as users expect
用户期望的搜索智能
  • 批准号:
    446426-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Search intelligence as users expect
用户期望的搜索智能
  • 批准号:
    121418-2013
  • 财政年份:
    2015
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Search intelligence as users expect
用户期望的搜索智能
  • 批准号:
    121418-2013
  • 财政年份:
    2014
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Exploring the Intrinsic Mechanisms of CEO Turnover and Market Reaction: An Explanation Based on Information Asymmetry
  • 批准号:
    W2433169
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国学者研究基金项目
SCIENCE CHINA Information Sciences
  • 批准号:
    61224002
  • 批准年份:
    2012
  • 资助金额:
    24.0 万元
  • 项目类别:
    专项基金项目
面向英汉双向跨语言图像检索的文本分析关键技术研究
  • 批准号:
    61170095
  • 批准年份:
    2011
  • 资助金额:
    57.0 万元
  • 项目类别:
    面上项目
非标准随机调度模型的最优动态策略
  • 批准号:
    71071056
  • 批准年份:
    2010
  • 资助金额:
    28.0 万元
  • 项目类别:
    面上项目
基于等值面法向量信息的医学图像自动配准算法研究及其临床应用
  • 批准号:
    60872103
  • 批准年份:
    2008
  • 资助金额:
    28.0 万元
  • 项目类别:
    面上项目
协同模板中的约束信息可视化
  • 批准号:
    60573174
  • 批准年份:
    2005
  • 资助金额:
    6.0 万元
  • 项目类别:
    面上项目
面向Web信息检索的随机P2P拓扑模型及语义网重构技术研究
  • 批准号:
    60573142
  • 批准年份:
    2005
  • 资助金额:
    20.0 万元
  • 项目类别:
    面上项目
量子信息资源理论与应用研究
  • 批准号:
    60573008
  • 批准年份:
    2005
  • 资助金额:
    22.0 万元
  • 项目类别:
    面上项目
无线网络中多用户合作分集技术研究
  • 批准号:
    60472079
  • 批准年份:
    2004
  • 资助金额:
    25.0 万元
  • 项目类别:
    面上项目

相似海外基金

Cancer Deep Phenotyping from Electronic Medical Records
根据电子病历进行癌症深度表型分析
  • 批准号:
    10594128
  • 财政年份:
    2022
  • 资助金额:
    $ 6.99万
  • 项目类别:
Deep information retrieval - diving into information granularity and abstraction
深度信息检索——深入信息粒度和抽象
  • 批准号:
    RGPIN-2018-05774
  • 财政年份:
    2021
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Advanced End-to-End Relation Extraction with Deep Neural Networks
使用深度神经网络进行高级端到端关系提取
  • 批准号:
    10386881
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
Cancer Deep Phenotype Extraction from Electronic Medical Records
从电子病历中提取癌症深层表型
  • 批准号:
    10058470
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
Advanced End-to-End Relation Extraction with Deep Neural Networks
使用深度神经网络进行高级端到端关系提取
  • 批准号:
    10200889
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
Cancer Deep Phenotype Extraction from Electronic Medical Records
从电子病历中提取癌症深层表型
  • 批准号:
    10268998
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
Attention-Aware Deep Learning for Information Retrieval from Gigapixel Histopathology Scans
用于从十亿像素组织病理学扫描中检索信息的注意力感知深度学习
  • 批准号:
    518775-2018
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Postgraduate Scholarships - Doctoral
Advanced End-to-End Relation Extraction with Deep Neural Networks
使用深度神经网络进行高级端到端关系提取
  • 批准号:
    10615695
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
Deep information retrieval - diving into information granularity and abstraction
深度信息检索——深入信息粒度和抽象
  • 批准号:
    RGPIN-2018-05774
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
    Discovery Grants Program - Individual
Cancer Deep Phenotype Extraction from Electronic Medical Records
从电子病历中提取癌症深层表型
  • 批准号:
    10472741
  • 财政年份:
    2020
  • 资助金额:
    $ 6.99万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了