III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
基本信息
- 批准号:2107248
- 负责人:
- 金额:$ 48万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2021
- 资助国家:美国
- 起止时间:2021-10-01 至 2025-09-30
- 项目状态:未结题
- 来源:
- 关键词:
项目摘要
Motivated by societal trends that value institutional openness and transparency, open data is being produced and shared at a speed that surpasses our ability to process it. Many governmental and private institutions are adopting Open Data Principles that state that the shared data is complete, accurate, and timely. These properties make this data of great value to data scientists, journalists, and the public. When Open Data is used effectively, data scientists can explore and analyze open resources, which in turn allows them to investigate public policy, create new scientific knowledge, and discover new (hidden) value useful for social, scientific, or economic initiatives. Though the open data movement has succeeded in its ambition of making data accessible, it has not succeed in making this valuable data easy to use. The overarching goal of this project is to address this shortcoming.In this project, we present a vision for Open Data Curation - data curation that is open, transparent, and explainable. Open Data Curation uses an on-demand integration paradigm that spans data discovery, data cleaning and linking, and data integration. Our vision is to enable users to query heterogeneous data stored in a data repository with minimal up-front effort. Users can reference concepts and attributes in their queries that do not exist in the data. An on-demand integration system (ODIS) responds to such requests by automatically determining what data could be transformed and integrated to provide data for a requested concept. In terms of societal impact, the project will provide the algorithmic innovations to make effective, intuitive on-demand integration over open data lakes a reality. Our solutions will use real open data and will be robust to the sometimes quirky, and always diverse, characteristics of open data. We believe a profound shift in how people think about data integration and curation is needed to fuel the data science revolution which is being held back by incoherent data curation - a task that is still considered one of the most time consuming, annoying, and error-prone in data science.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
受重视机构开放性和透明度的社会趋势的推动,开放数据正在以超过我们处理能力的速度产生和共享。许多政府和私人机构正在采用开放数据原则,该原则规定共享数据是完整的,准确的,及时的。 这些属性使这些数据对数据科学家、记者和公众具有巨大的价值。 当开放数据得到有效利用时,数据科学家可以探索和分析开放资源,这反过来又使他们能够调查公共政策,创造新的科学知识,并发现对社会,科学或经济举措有用的新(隐藏)价值。 尽管开放数据运动成功地实现了让数据可访问的雄心,但它并没有成功地让这些有价值的数据易于使用。这个项目的首要目标就是解决这个缺点。在这个项目中,我们提出了一个开放数据管理的愿景-数据管理是开放的,透明的,可解释的。 Open Data Curation使用一种按需集成范式,涵盖数据发现、数据清理和链接以及数据集成。 我们的愿景是使用户能够查询存储在数据存储库中的异构数据,只需最少的前期工作。 用户可以在查询中引用数据中不存在的概念和属性。 按需集成系统(ODIS)通过自动确定什么数据可以被转换和集成以提供用于所请求的概念的数据来响应这样的请求。 在社会影响方面,该项目将提供算法创新,使开放数据湖上有效、直观的按需集成成为现实。 我们的解决方案将使用真实的开放数据,并将对开放数据的有时古怪且总是多样的特征具有鲁棒性。 我们认为,人们对数据集成和策展的看法需要发生深刻的转变,以推动数据科学革命,这场革命正受到不连贯的数据策展的阻碍-这项任务仍然被认为是最耗时,最烦人,和错误-该奖项反映了NSF的法定使命,并被认为值得通过使用基金会的智力价值和更广泛的影响审查标准。
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
RONIN: data lake exploration
RONIN:数据湖探索
- DOI:10.14778/3476311.3476364
- 发表时间:2021
- 期刊:
- 影响因子:2.5
- 作者:Ouellette, Paul;Sciortino, Aidan;Nargesian, Fatemeh;Bashardoost, Bahar Ghadiri;Zhu, Erkang;Pu, Ken Q.;Miller, Renée J.
- 通讯作者:Miller, Renée J.
Data Lake Organization
- DOI:10.1109/tkde.2021.3091101
- 发表时间:2018-12
- 期刊:
- 影响因子:8.9
- 作者:F. Nargesian;Ken Pu;Bahar Ghadiri-Bashardoost;Erkang Zhu;Renée J. Miller
- 通讯作者:F. Nargesian;Ken Pu;Bahar Ghadiri-Bashardoost;Erkang Zhu;Renée J. Miller
DIALITE: Discover, Align and Integrate Open Data Tables
DIALITE:发现、调整和集成开放数据表
- DOI:10.1145/3555041.3589732
- 发表时间:2023
- 期刊:
- 影响因子:0
- 作者:Khatiwada, Aamod;Shraga, Roee;Miller, Renée J.
- 通讯作者:Miller, Renée J.
Integrating Data Lake Tables
集成数据湖表
- DOI:10.14778/3574245.3574274
- 发表时间:2022
- 期刊:
- 影响因子:2.5
- 作者:Khatiwada, Aamod;Shraga, Roee;Gatterbauer, Wolfgang;Miller, Renée J.
- 通讯作者:Miller, Renée J.
Semantics-Aware Dataset Discovery from Data Lakes with Contextualized Column-Based Representation Learning
通过基于上下文的列表示学习从数据湖中发现语义感知的数据集
- DOI:10.14778/3587136.3587146
- 发表时间:2023
- 期刊:
- 影响因子:2.5
- 作者:Fan, Grace;Wang, Jin;Li, Yuliang;Zhang, Dan;Miller, Renée J.
- 通讯作者:Miller, Renée J.
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Renee Miller其他文献
Estimation of Cardiac Valve Annuli Motion with Deep Learning
利用深度学习估计心脏瓣膜环运动
- DOI:
10.1007/978-3-030-68107-4_15 - 发表时间:
2020 - 期刊:
- 影响因子:1.9
- 作者:
E. Kerfoot;C. E. King;T. Ismail;D. Nordsletten;Renee Miller - 通讯作者:
Renee Miller
Identification of Transversely Isotropic Properties from Magnetic Resonance Elastography Using the Optimised Virtual Fields Method
使用优化虚拟场方法从磁共振弹性成像中识别横向各向同性特性
- DOI:
10.1007/978-3-319-59448-4_40 - 发表时间:
2017 - 期刊:
- 影响因子:3.9
- 作者:
Renee Miller;A. Kolipaka;M. Nash;A. Young - 通讯作者:
A. Young
Functional Characterization of Antibodies Neutralizing Soluble Factors In Vitro and In Vivo
体外和体内中和可溶性因子抗体的功能表征
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
G. Veldman;Z. Kaymakcalan;Renee Miller;L. Kalghatgi;J. Salfeld - 通讯作者:
J. Salfeld
A computational study of post-infarct mechanical effects of injected biomaterial into ischaemic myocardium
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Renee Miller - 通讯作者:
Renee Miller
Innovative Application of Cerebral rSO2 Monitoring During Shunt Tap in Pediatric Ventricular Malfunctioning Shunts
儿科心室功能不全分流分流期间脑 rSO2 监测的创新应用
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:1.4
- 作者:
T. Abramo;Chuan Zhou;C. Estrada;M. Meredith;Renee Miller;M. Pearson;N. Tulipan;Abby M. Williams - 通讯作者:
Abby M. Williams
Renee Miller的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Renee Miller', 18)}}的其他基金
III: Small: Semantic Version Management in Data Lakes
III:小:数据湖中的语义版本管理
- 批准号:
2325632 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
III: Medium: Table-as-Query: Unifying Data Discovery and Alignment
III:媒介:表即查询:统一数据发现和对齐
- 批准号:
1956096 - 财政年份:2020
- 资助金额:
$ 48万 - 项目类别:
Continuing Grant
CAREER: Managing Schematic Heterogeneity in Database Management Systems
职业:管理数据库管理系统中的原理图异构性
- 批准号:
9702974 - 财政年份:1997
- 资助金额:
$ 48万 - 项目类别:
Continuing Grant
相似海外基金
III : Medium: Collaborative Research: From Open Data to Open Data Curation
III:媒介:协作研究:从开放数据到开放数据管理
- 批准号:
2420691 - 财政年份:2024
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Designing AI Systems with Steerable Long-Term Dynamics
合作研究:III:中:设计具有可操纵长期动态的人工智能系统
- 批准号:
2312865 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
- 批准号:
2312932 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
- 批准号:
2415562 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
III: Medium: Collaborative Research: Integrating Large-Scale Machine Learning and Edge Computing for Collaborative Autonomous Vehicles
III:媒介:协作研究:集成大规模机器学习和边缘计算以实现协作自动驾驶汽车
- 批准号:
2348169 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Continuing Grant
Collaborative Research: III: Medium: VirtualLab: Integrating Deep Graph Learning and Causal Inference for Multi-Agent Dynamical Systems
协作研究:III:媒介:VirtualLab:集成多智能体动态系统的深度图学习和因果推理
- 批准号:
2312501 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: Knowledge discovery from highly heterogeneous, sparse and private data in biomedical informatics
合作研究:III:中:生物医学信息学中高度异构、稀疏和私有数据的知识发现
- 批准号:
2312862 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
Collaborative Research: III: MEDIUM: Responsible Design and Validation of Algorithmic Rankers
合作研究:III:媒介:算法排序器的负责任设计和验证
- 批准号:
2312930 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
Collaborative Research: III: Medium: New Machine Learning Empowered Nanoinformatics System for Advancing Nanomaterial Design
合作研究:III:媒介:新的机器学习赋能纳米信息学系统,促进纳米材料设计
- 批准号:
2347592 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant
Collaborative Research: IIS: III: MEDIUM: Learning Protein-ish: Foundational Insight on Protein Language Models for Better Understanding, Democratized Access, and Discovery
协作研究:IIS:III:中等:学习蛋白质:对蛋白质语言模型的基础洞察,以更好地理解、民主化访问和发现
- 批准号:
2310113 - 财政年份:2023
- 资助金额:
$ 48万 - 项目类别:
Standard Grant