RAPID: Automated discovery of COVID-19 related hypotheses using publicly available scientific literature

RAPID:使用公开的科学文献自动发现 COVID-19 相关假设

基本信息

  • 批准号:
    2127776
  • 负责人:
  • 金额:
    $ 10.45万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2020
  • 资助国家:
    美国
  • 起止时间:
    2020-10-01 至 2022-04-30
  • 项目状态:
    已结题

项目摘要

The vast amounts of biomedical information that accumulate in modern databases (such as MEDLINE of the National Library of Medicine) impose a great difficulty for efficient wide surveying by researchers who try to evaluate new information considering existing biomedical literature even when advanced information search engines are used. Automated hypotheses generation systems are designed to help scientists to overcome these difficulties and accelerate their research. The pandemic situation with COVID-19 is precisely one of the cases when such systems can play an extremely important role in coping with the coronavirus. Using two different AI approaches, we have developed two systems to discover plausible hypotheses in the biomedical domain. In this project, we will will deploy the COVID-19 customized hypothesis generation and knowledge discovery system, massively run it on any relevant to this research queries, and publish the results (including trained AI models, and discovered information) in the open domain for broad scientific community with the goal to accelerate the COVID-19 research. This work focuses heavily on addressing fundamental knowledge discovery questions by modeling and formulating scientific hypotheses using the publicly available information in the biomedical domain. However, in general, these methods are not restricted to any specific information domain, i.e., they can be broadly used to discover knowledge in texts. Although our experimental work will be related to COVID-19, the methods can be applied with some reservations to any literature-based analysis. For example, in the Materials Science Initiative, one of the goals is to establish a systematic understanding of the material properties and discover new materials which can be done by analyzing using the massive corpus of papers. In the legal world, identifying related patents can be done using a similar hypothesis modeling methodology.In the heart of the proposed approach lies a big multi-modal and multi-relational semantic knowledge network of all biomedical objects extracted from a variety of heterogeneous databases of the National Library of Medicine. These objects include but are not limited to scientific papers, abstracts, keywords, phrases, elements of thesaurus, genes, proteins, mutations, pathways, diseases, and diagnoses. We will leverage two systems, namely MOLIERE and AGATHA, that are based on structural and deep learning, respectively. We will customize them using the rapidly updated dataset of new papers that has not been yet processed by the National Library of Medicine but already exists in the open domain such as in various preprint archives and reports. The MOLIERE system is based on the network analysis techniques applied on the graph constructed using the low-dimensional embedding of the papers with the result interpretation methods that are based on the probabilistic topic modeling. The AGATHA system processes texts at much finer granularity, and creates a semantic knowledge network using more accurate embedding techniques followed by the deep learning training for knowledge discovery. Two systems complement each other. While the AGATHA is of higher quality, the MOLIERE is more interpretable. A combination of both will be leveraged in this research.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
在现代数据库中积累的大量生物医学信息(例如国家医学图书馆的MEDLINE)对于研究人员进行了有效的广泛测量,他们试图评估新信息,即使使用高级信息搜索引擎,他们也试图评估新信息。自动假设生成系统旨在帮助科学家克服这些困难并加速其研究。 Covid-19的大流行状况正是这种系统在应对冠状病毒中起着极为重要的作用的情况之一。使用两种不同的AI方法,我们开发了两个系统,以发现生物医学领域中的合理假设。在这个项目中,我们将在与本研究查询相关的任何与任何相关的任何相关的自定义假设生成和知识发现系统中部署Covid-19,并将结果(包括训练有素的AI模型和发现的信息)发布到开放的领域中,以实现广泛的科学界的范围,目的是加速Covid-1919研究。这项工作主要致力于通过使用生物医学领域中的公共信息对科学假设进行建模和制定科学假设来解决基本知识发现问题。但是,通常,这些方法不仅限于任何特定的信息域,即,它们可以广泛用于发现文本中的知识。尽管我们的实验工作将与COVID-19有关,但可以将这些方法应用于任何基于文献的分析。例如,在《材料科学计划》中,目标之一是建立对材料特性的系统理解,并发现可以通过使用大量论文来分析来完成的新材料。在法律世界中,可以使用类似的假设建模方法来识别相关专利。在拟议方法的核心中,所有生物医学对象是从国家医学图书馆的各种异构数据库中提取的所有生物医学对象的大型多模式和多关系语义知识网络。这些对象包括但不限于科学论文,摘要,关键字,短语,词库,基因,蛋白质,突变,途径,疾病和诊断的元素。我们将利用分别基于结构和深度学习的两个系统,即Moliere和Agatha。我们将使用尚未由国家医学图书馆处理的新论文的快速更新的新论文数据集自定义它们,但已经存在于开放型域中,例如在各种预印本档案和报告中。 Moliere系统基于使用论文的低维嵌入构建的图表上的网络分析技术,其结果是基于概率主题建模的结果解释方法。 Agatha系统以更精细的粒度处理文本,并使用更准确的嵌入技术创建语义知识网络,然后是深度学习培训以进行知识发现。两个系统相互补充。尽管Agatha的质量更高,但Moliere更容易解释。这项研究将利用两者的结合。该奖项反映了NSF的法定任务,并被认为是使用基金会的知识分子优点和更广泛影响的评论标准的评估值得支持的。

项目成果

期刊论文数量(1)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Accelerating COVID-19 Research with Graph Mining and Transformer-Based Learning
通过图挖掘和基于 Transformer 的学习加速 COVID-19 研究
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Ilya Safro其他文献

FAIRLEARN: Configurable and Interpretable Algorithmic Fairness
FAIRLEARN:可配置和可解释的算法公平性
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Ankit Kulshrestha;Ilya Safro
  • 通讯作者:
    Ilya Safro
Algebraic Distance on Graphs
图上的代数距离
Randomized heuristics for exploiting Jacobian scarcity
利用雅可比稀缺性的随机启发式
A Measure of the Connection Strengths between Graph Vertices with Applications
图顶点间连接强度的测量及其应用
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Jie Chen;Ilya Safro
  • 通讯作者:
    Ilya Safro
Partitioning Dense Graphs with Hardware Accelerators
使用硬件加速器对密集图进行分区

Ilya Safro的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Ilya Safro', 18)}}的其他基金

RAPID: Automated discovery of COVID-19 related hypotheses using publicly available scientific literature
RAPID:使用公开的科学文献自动发现 COVID-19 相关假设
  • 批准号:
    2027864
  • 财政年份:
    2020
  • 资助金额:
    $ 10.45万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: QIA: Large Scale QAOA Quantum Simulator
合作研究:EAGER:QIA:大规模 QAOA 量子模拟器
  • 批准号:
    2035606
  • 财政年份:
    2020
  • 资助金额:
    $ 10.45万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: QIA: Large Scale QAOA Quantum Simulator
合作研究:EAGER:QIA:大规模 QAOA 量子模拟器
  • 批准号:
    2122793
  • 财政年份:
    2020
  • 资助金额:
    $ 10.45万
  • 项目类别:
    Standard Grant
EAGER: SSDIM: Multiscale Methods for Generating Infrastructure Networks
EAGER:SSDIM:生成基础设施网络的多尺度方法
  • 批准号:
    1745300
  • 财政年份:
    2017
  • 资助金额:
    $ 10.45万
  • 项目类别:
    Standard Grant
EAGER: Feedback-based Network Optimization for Smart Cities
EAGER:基于反馈的智慧城市网络优化
  • 批准号:
    1647361
  • 财政年份:
    2016
  • 资助金额:
    $ 10.45万
  • 项目类别:
    Standard Grant
Fast and Scalable Multigrid Methods for Hypergraph Partitioning Problems
超图分区问题的快速且可扩展的多重网格方法
  • 批准号:
    1522751
  • 财政年份:
    2015
  • 资助金额:
    $ 10.45万
  • 项目类别:
    Standard Grant

相似国自然基金

工业自动化与创新的产业外溢:理论与实证
  • 批准号:
    72302245
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
开发2’-氟阿拉伯糖核酸的自动化Sanger测序新方法
  • 批准号:
    22307058
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
基于深度学习的三维物体智能化抓取策略及机械手自动化结构设计研究
  • 批准号:
    62302517
  • 批准年份:
    2023
  • 资助金额:
    30.00 万元
  • 项目类别:
    青年科学基金项目
全自动化运行城市轨道交通乘务计划优化问题研究
  • 批准号:
    72301192
  • 批准年份:
    2023
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
当机器成为我们的领导:领导职能自动化的内涵、测量及其多层次后果研究
  • 批准号:
    72371260
  • 批准年份:
    2023
  • 资助金额:
    40.00 万元
  • 项目类别:
    面上项目

相似海外基金

Accelerating discovery of the human foveal microconnectome with deep learning
通过深度学习加速人类中心凹微连接组的发现
  • 批准号:
    10411154
  • 财政年份:
    2022
  • 资助金额:
    $ 10.45万
  • 项目类别:
Explainable Deep Learning Approach for Automatic Arousal and Sleep Stages Scoring, and Knowledge Discovery
用于自动唤醒和睡眠阶段评分以及知识发现的可解释深度学习方法
  • 批准号:
    10491362
  • 财政年份:
    2021
  • 资助金额:
    $ 10.45万
  • 项目类别:
Explainable Deep Learning Approach for Automatic Arousal and Sleep Stages Scoring, and Knowledge Discovery
用于自动唤醒和睡眠阶段评分以及知识发现的可解释深度学习方法
  • 批准号:
    10291585
  • 财政年份:
    2021
  • 资助金额:
    $ 10.45万
  • 项目类别:
Schlemm’s canal on a chip: A platform for screening a novel class of glaucoma medications
施莱姆氏管芯片:用于筛选新型青光眼药物的平台
  • 批准号:
    10475283
  • 财政年份:
    2021
  • 资助金额:
    $ 10.45万
  • 项目类别:
Schlemm’s canal on a chip: A platform for screening a novel class of glaucoma medications
施莱姆氏管芯片:用于筛选新型青光眼药物的平台
  • 批准号:
    10293948
  • 财政年份:
    2021
  • 资助金额:
    $ 10.45万
  • 项目类别:
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了