III: Small: Improving Technical Paper Database Search through Math-Aware Search Engines

III:小:通过数学感知搜索引擎改进技术论文数据库搜索

基本信息

  • 批准号:
    1717997
  • 负责人:
  • 金额:
    $ 49.89万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2017
  • 资助国家:
    美国
  • 起止时间:
    2017-12-01 至 2022-01-31
  • 项目状态:
    已结题

项目摘要

Today's search engines make use of sophisticated techniques for searching based upon words, but are not able to make nuanced use of mathematical notation. This project aims to allow scientists, engineers, mathematicians, and students to locate technical information using words, mathematical notation, or some of each. For example, a mathematician studying graph theory could use these new capabilities to find related applications in physics, ecology, and social network analysis, despite any differences in the notation and terminology used in those disciplines. Given a large collection of technical documents, we will apply machine learning techniques to construct associations between the formulae and words used to explain mathematical ideas, and determine how to translate automatically between those two forms of expression. These associations and translations can then be used by students who write what they are looking for using words, with the search engine finding documents that express those same ideas, even if only in mathematical notation. These new math-aware search engines will accelerate innovation by allowing searchers to discover information both across technical disciplines and, by using mathematical notation as a pivot, even across human languages.To accomplish these goals, the project will develop novel scalable techniques for indexing and retrieval of mathematical content in technical documents. These methods will accommodate a broad range of notational conventions, formats, and encodings. New context-based methods for inferring associations between formulae and related text will be used to build rich and flexible models of content equivalence. These equivalence models will be used in new ranking algorithms that integrate results found using words or using mathematical notation into a single ranked list. Open-source reference implementations will be shared publicly, and new test collections created to evaluate these implementations will be shared with other researchers. To gain experience with the use of these new capabilities, the project will add math-aware search to the CiteSeerX digital library of scientific literature. CiteSeerX is an open Web service that can be used to compare alternative retrieval methods in actual use. For further information see the project Web page: https://www.cs.rit.edu/~dprl/math-aware-search.html.
今天的搜索引擎使用复杂的技术进行基于单词的搜索,但不能使用微妙的数学符号。该项目旨在允许科学家、工程师、数学家和学生使用文字、数学符号或两者中的一部分来定位技术信息。例如,学习图论的数学家可以使用这些新功能在物理、生态和社会网络分析中找到相关应用,尽管这些学科使用的符号和术语有任何差异。在给定大量技术文档的情况下,我们将应用机器学习技术来构建用于解释数学思想的公式和单词之间的关联,并确定如何在这两种表达形式之间自动翻译。然后,这些联想和翻译可以被学生使用,他们用单词写下他们想要的东西,搜索引擎会找到表达同样想法的文档,即使只是用数学符号。这些新的具有数学意识的搜索引擎将通过允许搜索者发现跨技术学科的信息,并通过使用数学符号作为支点,甚至跨人类语言来加速创新。为了实现这些目标,该项目将开发新的可扩展技术,用于索引和检索技术文档中的数学内容。这些方法将适应广泛的符号约定、格式和编码。将使用新的基于上下文的方法来推断公式与相关文本之间的关联,以建立丰富而灵活的内容等值模型。这些等价性模型将用于新的排名算法,该算法将使用单词或数学符号找到的结果整合到单个排名列表中。开源参考实现将被公开共享,为评估这些实现而创建的新测试集合将与其他研究人员共享。为了获得使用这些新功能的经验,该项目将在CiteSeerX科学文献数字图书馆中添加数学感知搜索。CiteSeerX是一种开放的Web服务,可用于比较实际使用的替代检索方法。有关更多信息,请参阅项目网页:https://www.cs.rit.edu/~dprl/math-aware-search.html.

项目成果

期刊论文数量(28)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Visual Parsing with Query-Driven Global Graph Attention (QD-GGA): Preliminary Results for Handwritten Math Formula Recognition
Advancing Math-Aware Search: The ARQMath-3 Lab at CLEF 2022
推进数学感知搜索:CLEF 2022 的 ARQMath-3 实验室
  • DOI:
    10.1007/978-3-030-99739-7_51
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mansouri, Behrooz;Agarwal, Anurag;Oard, Douglas W.;Zanibbi, Richard
  • 通讯作者:
    Zanibbi, Richard
Accelerating Substructure Similarity Search for Formula Retrieval
  • DOI:
    10.1007/978-3-030-45439-5_47
  • 发表时间:
    2020-03-17
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Zhong W;Rohatgi S;Wu J;Giles CL;Zanibbi R
  • 通讯作者:
    Zanibbi R
MathSeer: A Math-Aware Search Interface with Intuitive Formula Editing, Reuse, and Lookup
  • DOI:
    10.1007/978-3-030-45442-5_60
  • 发表时间:
    2020-03-24
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Nishizawa G;Liu J;Diaz Y;Dmello A;Zhong W;Zanibbi R
  • 通讯作者:
    Zanibbi R
Third CLEF Lab on Answer Retrieval for Questions on Math (Working Notes Version
第三次 CLEF 数学问题答案检索实验室(工作笔记版本
  • DOI:
  • 发表时间:
    2022
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Mansouri, Behrooz;Novotný, Vít;Agarwal, Anurag;Oard, Douglas W.;Zanibbi, Richard
  • 通讯作者:
    Zanibbi, Richard
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Richard Zanibbi其他文献

MathIR Task Overview
MathIR 任务概述
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Richard Zanibbi;Akiko Aizawa;Michael Kohlhase;Iadh Ounis;Goran Topic;Kenny Davila
  • 通讯作者:
    Kenny Davila
教員志望者が保護者対応を学ぶ意義と範囲
学习如何与家长打交道对于教师来说的意义和范围
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Richard Zanibbi;Akiko Aizawa;Michael Kohlhase;Iadh Ounis;Goran Topic;Kenny Davila;小野田正利;小野田正利
  • 通讯作者:
    小野田正利
教師を続けるのがつらいことが当たり前の時代のなかで
在一个教师难以继续工作的时代,
  • DOI:
  • 发表时间:
    2013
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Richard Zanibbi;Akiko Aizawa;Michael Kohlhase;Iadh Ounis;Goran Topic;Kenny Davila;小野田正利
  • 通讯作者:
    小野田正利

Richard Zanibbi的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Richard Zanibbi', 18)}}的其他基金

III: Small: Combining Algorithms for Recognition and Retrieval of Mathematics
三:小:数学识别与检索的组合算法
  • 批准号:
    1016815
  • 财政年份:
    2010
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: A Big Data and Machine Learning Approach for Improving the Efficiency of Two-sided Online Labor Markets
III:小:提高双边在线劳动力市场效率的大数据和机器学习方法
  • 批准号:
    2311582
  • 财政年份:
    2023
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: Small: RUI: Investigating Fragmentation Rules and Improving Metabolite Identification Using Graph Grammar and Statistical Methods
III:小:RUI:使用图语法和统计方法研究断裂规则并改进代谢物识别
  • 批准号:
    2053286
  • 财政年份:
    2020
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Harnessing Big Data for Improving Career Mobility
III:小:协作研究:利用大数据提高职业流动性
  • 批准号:
    2007437
  • 财政年份:
    2020
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: Small: Improving automation and speed of macromolecule recognition and localization in cryo-electron tomography using unsupervised deep learning
III:小:使用无监督深度学习提高冷冻电子断层扫描中大分子识别和定位的自动化程度和速度
  • 批准号:
    2007595
  • 财政年份:
    2020
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Harnessing Big Data for Improving Career Mobility
III:小:协作研究:利用大数据提高职业流动性
  • 批准号:
    2006387
  • 财政年份:
    2020
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: SMALL: Moving Beyond Knowledge to Action: Evaluating and Improving the Utility of Causal Inference
III:小:超越知识到行动:评估和提高因果推理的实用性
  • 批准号:
    1907951
  • 财政年份:
    2019
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Continuing Grant
III: Small: RUI: Investigating Fragmentation Rules and Improving Metabolite Identification Using Graph Grammar and Statistical Methods
III:小:RUI:使用图语法和统计方法研究断裂规则并改进代谢物识别
  • 批准号:
    1813252
  • 财政年份:
    2019
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: Small: Improving de novo Genome Assembly using Optical Maps
III:小:使用光学图谱改进从头基因组组装
  • 批准号:
    1814359
  • 财政年份:
    2018
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: Small: Improving Information Retrieval by Analysis of Temporal Evidence in a Unified Model
III:小:通过分析统一模型中的时间证据来改进信息检索
  • 批准号:
    1217279
  • 财政年份:
    2012
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Standard Grant
III: Small: RUI: Improving Data Quality and Data Mining Using Noisy Micro-Outsourcing
III:小:RUI:使用嘈杂的微外包提高数据质量和数据挖掘
  • 批准号:
    1115417
  • 财政年份:
    2011
  • 资助金额:
    $ 49.89万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了