EAGER Collaborative Research: Bringing Together Computational and Linguistic Methods to Extract 'Dark' Geosciences Data for the EarthCube Framework

EAGER 协作研究:结合计算和语言方法为 EarthCube 框架提取“暗”地球科学数据

基本信息

  • 批准号:
    1242909
  • 负责人:
  • 金额:
    $ 6.95万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2012
  • 资助国家:
    美国
  • 起止时间:
    2012-07-15 至 2013-06-30
  • 项目状态:
    已结题

项目摘要

A large percentage of vaulable geoscience data is based on the analysis of discrete samples and is collected manually (e.g., paleontological collections, structural/tectonic data, petrographic/mineralogic data, economic data, geochemical measurements, rock mechanics, etc.) Often, these data are reported only in tables in the published literature or in .pdf or spreadsheets on individual investigator websites. Commonly these data are not registerd on or entered into standardized, publicly accessible databases. As a result, for this data to be discovered and used/reused, researchers or other interested parties must manually comb through the text, figures, and appendices of journal articles or websites of individual investigators, sometimes having to sift through raw experimental data. This process is extremely time intensive and slows down the time needed to make scientific discoveries or allow verification of research results. As a result the vast amount of surface earth geoscience data is currently inaccessible. This inaccessible data is termed "Dark Data". This EAGER combines the expertise of top-notch computer scientists and geoscientists whose goal is to create a search algorithm to bring this dark data to light in a way that will enable the next generation of integrative geoscience research. The approach will involved development of an innovative search engine "crawler" that will comb the geoscience literature and bring dark data to light from the text and figures in this corpus. The cyberinfrastructure tool being developed will be able to interpret the semantics of English text and the concepts of geoscience. The tool will be piloted by examining entries on the Macrostrat database, a structured spatial database of lithologic and geochronologic information, and then employing a geoscience ontology by means of the Hazy framework for information extraction. Questions to be addressed will be to find out to what extent dark data is presently accessible and if it can be extracted and placed into an accessible format and repository where it can be discovered by web services or other search engines. Broader impacts of the work include training of graduate students and increasing the infrastructure for science through the development of a new and much needed data search tool.
很大一部分有价值的地球科学数据是基于对离散样本的分析和人工收集的(例如,古生物学收集、构造/构造数据、岩石学/矿物学数据、经济数据、地球化学测量、岩石力学等)。通常,这些数据仅以已发表文献中的表格或个人研究者网站上的pdf或电子表格的形式报告。通常,这些数据没有登记或输入标准化的、可公开访问的数据库。因此,为了发现和使用/重复使用这些数据,研究人员或其他感兴趣的各方必须手动梳理文本、图表和期刊文章或个人研究人员网站的附录,有时不得不筛选原始实验数据。这个过程非常耗时,减慢了做出科学发现或验证研究结果所需的时间。因此,目前还无法获得大量的地表地球科学数据。这些无法获取的数据被称为“暗数据”。这个EAGER项目结合了顶尖计算机科学家和地球科学家的专业知识,他们的目标是创建一种搜索算法,将这些黑暗数据以一种能够实现下一代综合地球科学研究的方式展现出来。该方法将涉及开发一种创新的搜索引擎“爬虫”,该搜索引擎将梳理地学文献,并从该语料库中的文本和图形中揭示黑暗数据。正在开发的网络基础设施工具将能够解释英语文本的语义和地球科学的概念。该工具将通过检查macrostrata数据库(一个结构化的岩性和地质年代学信息空间数据库)上的条目进行试点,然后通过Hazy框架使用地球科学本体进行信息提取。要解决的问题将是找出暗数据目前可访问的程度,以及是否可以将其提取并放入可访问的格式和存储库中,以便网络服务或其他搜索引擎发现。这项工作的更广泛的影响包括培养研究生和通过开发一种新的和急需的数据搜索工具来增加科学的基础设施。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Christopher Jenkins其他文献

Quotients by Idempotent Functions in Cedille
Cedille 中幂等函数的商
Periocular migration of an intraocular lens.
人工晶状体的眼周迁移。
  • DOI:
    10.1136/bjo.76.11.688
  • 发表时间:
    1992
  • 期刊:
  • 影响因子:
    4.1
  • 作者:
    Christopher Jenkins
  • 通讯作者:
    Christopher Jenkins
Testing Large Ultra-Lightweight Spacecraft
测试大型超轻型航天器
  • DOI:
    10.2514/4.104657
  • 发表时间:
    2017
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Christopher Jenkins;J. Banik
  • 通讯作者:
    J. Banik
Elaborating Inductive Definitions and Course-of-Values Induction in Cedille.
在 Cedille 中阐述归纳定义和价值过程归纳。
  • DOI:
  • 发表时间:
    2019
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Christopher Jenkins;Colin McDonald;Aaron Stump
  • 通讯作者:
    Aaron Stump
Advances in ENF Database Configuration for Forensic Authentication of Digital Media
用于数字媒体取证认证的 ENF 数据库配置的进展
  • DOI:
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Catalin Grigoras;Jeff M. Smith;Christopher Jenkins
  • 通讯作者:
    Christopher Jenkins

Christopher Jenkins的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Christopher Jenkins', 18)}}的其他基金

C1F21 DIBBS: Porting Practical Natural Language Processing (NLP) and Machine Learning (ML) Semantics from Biomedicine to the Earth, Ice and Life Sciences
C1F21 DIBBS:将实用自然语言处理 (NLP) 和机器学习 (ML) 语义从生物医学移植到地球、冰和生命科学
  • 批准号:
    1443085
  • 财政年份:
    2014
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: Population Ecology Models for Carbonate Sediments
合作研究:碳酸盐沉积物的种群生态模型
  • 批准号:
    1118297
  • 财政年份:
    2011
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
RAPID: Seamless Marine-wetlands-coastal Soils Database to Support Urgent Decision-making Against the Deepwater Horizon Coastal Oiling
RAPID:无缝海洋-湿地-沿海土壤数据库,支持针对深水地平线沿海石油开采的紧急决策
  • 批准号:
    1047776
  • 财政年份:
    2010
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: CoreWall--Integrated Environment for Interpretation of Geoscientific Data from Sediment and Crystalline Cores
合作研究:CoreWall——解释沉积物和晶体岩心地球科学数据的集成环境
  • 批准号:
    0601978
  • 财政年份:
    2006
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant

相似海外基金

Collaborative Research: EAGER: The next crisis for coral reefs is how to study vanishing coral species; AUVs equipped with AI may be the only tool for the job
合作研究:EAGER:珊瑚礁的下一个危机是如何研究正在消失的珊瑚物种;
  • 批准号:
    2333604
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347624
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: Revealing the Physical Mechanisms Underlying the Extraordinary Stability of Flying Insects
EAGER/合作研究:揭示飞行昆虫非凡稳定性的物理机制
  • 批准号:
    2344215
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345581
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345582
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Designing Nanomaterials to Reveal the Mechanism of Single Nanoparticle Photoemission Intermittency
合作研究:EAGER:设计纳米材料揭示单纳米粒子光电发射间歇性机制
  • 批准号:
    2345583
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: Energy for persistent sensing of carbon dioxide under near shore waves.
合作研究:EAGER:近岸波浪下持续感知二氧化碳的能量。
  • 批准号:
    2339062
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: IMPRESS-U: Groundwater Resilience Assessment through iNtegrated Data Exploration for Ukraine (GRANDE-U)
合作研究:EAGER:IMPRESS-U:通过乌克兰综合数据探索进行地下水恢复力评估 (GRANDE-U)
  • 批准号:
    2409395
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
Collaborative Research: EAGER: The next crisis for coral reefs is how to study vanishing coral species; AUVs equipped with AI may be the only tool for the job
合作研究:EAGER:珊瑚礁的下一个危机是如何研究正在消失的珊瑚物种;
  • 批准号:
    2333603
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
EAGER/Collaborative Research: An LLM-Powered Framework for G-Code Comprehension and Retrieval
EAGER/协作研究:LLM 支持的 G 代码理解和检索框架
  • 批准号:
    2347623
  • 财政年份:
    2024
  • 资助金额:
    $ 6.95万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了