CIF21 DIBBs: User Driven Architecture for Data Discovery
CIF21 DIBB:用户驱动的数据发现架构
基本信息
- 批准号:1443070
- 负责人:
- 金额:$ 148.49万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2014
- 资助国家:美国
- 起止时间:2014-09-01 至 2018-04-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The number, size, and availability of scientific datasets have grown enormously over the last few years. As scientific activity becomes more data intensive and collaborative, a key challenge for cross-disciplinary research will be discovery of diverse data sets, managed within distributed repositories and registries. Currently, discovery of information on the Internet is largely performed through automated approaches, characterized by web crawling and associated algorithms, or labor intensive indexing and categorization, such as the National Library of Medicine index for medical literature. There are significant amounts of data housed in repositories where only researchers with expertise in the specific field know and access the data.This project builds a user driven architecture for data discovery (UDADD), a capability that enhances discovery of scientific datasets by building a global index from diverse communities with minimal input. In the UDADD approach user actions, such as dataset queries or downloads, drive the construction of a global index. These actions are recorded and gathered automatically, through cooperation with repository managers. Two software plugins are provided to help the repositories interact with the UDADD system. The architecture includes ranking techniques based on frequency and recency of use of the datasets. The pilot architecture will be demonstrated and evaluated using cooperating repositories within the DataNet Federation Consortium. Currently, six science and engineering communities participate in the consortium, including national scale projects in oceanography, social science, cognitive science, hydrology, engineering, and plant biology.
在过去几年中,科学数据集的数量、规模和可用性都大幅增长。 随着科学活动变得更加数据密集和协作,跨学科研究的一个关键挑战将是发现在分布式存储库和注册表中管理的不同数据集。 目前,互联网上的信息发现主要通过自动化方法进行,其特点是网络爬行和相关算法,或劳动密集型索引和分类,例如国家医学图书馆的医学文献索引。 存储库中存储着大量数据,只有具有特定领域专业知识的研究人员才能了解和访问这些数据。该项目构建了一个用户驱动的数据发现架构 (UDADD),该功能通过以最少的输入从不同社区构建全球索引来增强科学数据集的发现。 在 UDADD 方法中,用户操作(例如数据集查询或下载)驱动全局索引的构建。通过与存储库管理员的合作,这些操作会被自动记录和收集。提供了两个软件插件来帮助存储库与 UDADD 系统交互。该架构包括基于数据集使用频率和新近度的排名技术。该试点架构将使用 DataNet Federation Consortium 内的合作存储库进行演示和评估。 目前,有六个科学和工程界参与该联盟,包括海洋学、社会科学、认知科学、水文学、工程学和植物生物学领域的国家级项目。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Giridhar Manepalli其他文献
D2D: Digital Archive to MPEG-21 DIDL
D2D:数字存档到 MPEG-21 DIDL
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Suchitra Manepalli;Giridhar Manepalli;Michael L. Nelson - 通讯作者:
Michael L. Nelson
Giridhar Manepalli的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Giridhar Manepalli', 18)}}的其他基金
Type-Based Automation of Scientific Data Management
基于类型的科学数据管理自动化
- 批准号:
1838981 - 财政年份:2018
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
相似海外基金
CIF21 DIBBs: EI: Virtual Data Collaboratory: A Regional Cyberinfrastructure for Collaborative Data Intensive Science
CIF21 DIBB:EI:虚拟数据协作:协作数据密集型科学的区域网络基础设施
- 批准号:
2220826 - 财政年份:2021
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: PD: Cyberinfrastructure Tools for Precision Agriculture in the 21st Century
CIF21 DIBB:PD:21 世纪精准农业的网络基础设施工具
- 批准号:
1854312 - 财政年份:2018
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: EI: Creating a Digital Environment for Enabling Data-Driven Science (DEEDS)
CIF21 DIBB:EI:创建数字环境以实现数据驱动科学 (DEEDS)
- 批准号:
1724728 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: EI: North East Storage Exchange
CIF21 DIBB:EI:东北存储交易所
- 批准号:
1753840 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: EI: SLATE and the Mobility of Capability
CIF21 DIBB:EI:SLATE 和能力流动性
- 批准号:
1724821 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Continuing Grant
CIF21 DIBBs: EI: Integrated Platform for Applied Network Data Analysis (PANDA)
CIF21 DIBB:EI:应用网络数据分析集成平台 (PANDA)
- 批准号:
1724853 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: PD: OneDataShare: A Universal Data Sharing Building Block for Data-Intensive Applications
CIF21 DIBB:PD:OneDataShare:数据密集型应用程序的通用数据共享构建块
- 批准号:
1724898 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: PD: Accelerating Comparative Metagenomics through an Ocean Cloud Commons
CIF21 DIBB:PD:通过海洋云共享加速比较宏基因组学
- 批准号:
1640775 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: PD: Cyberinfrastructure Tools for Precision Agriculture in the 21st Century
CIF21 DIBB:PD:21 世纪精准农业的网络基础设施工具
- 批准号:
1724843 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant
CIF21 DIBBs: EI: Vizier, Streamlined Data Curation
CIF21 DIBB:EI:Vizier,简化的数据管理
- 批准号:
1640864 - 财政年份:2017
- 资助金额:
$ 148.49万 - 项目类别:
Standard Grant














{{item.name}}会员




