Transforming Data Discovery Through Behavior Modeling and Recommendation

通过行为建模和推荐转变数据发现

基本信息

项目摘要

Social scientists are encouraged to share their data so that their work can be evaluated, replicated, and extended. Open science movements and public funding for science, especially, have increased the number and breadth of datasets that scientists share for reuse and inspection. However, sharing data does not guarantee that it will be found and reused. Search technologies have been enhanced by recommender systems, but they have not been widely applied to research data. A better understanding of how researchers search for existing data is needed in order to design systems to recommend relevant data to researchers. This study will determine if redesigning data search systems to include recommended results can help social scientists discover datasets to reuse effectively. The results of this project will help data archives ensure returns on our national investments in scientific data by increasing data reuse and will promote scientific progress by connecting researchers with relevant data.The project will a) develop a model of human information behavior that explains how social scientists currently search for data, b) design a prototype data recommender system, and c) evaluate the model and system through field experiments. How data search compares to other information behaviors such as general search is not clear, and this project will explain how data search unfolds. The project also determines whether recommendation systems, popular in fields such as book and movie recommendations, can also work for data and increase their reuse.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
鼓励社会科学家分享他们的数据,以便对他们的工作进行评估、复制和扩展。尤其是开放科学运动和对科学的公共资助,增加了科学家共享的数据集的数量和广度,以供重复使用和检查。然而,共享数据并不能保证它会被找到和重复使用。推荐系统已经增强了搜索技术,但它们还没有广泛应用于研究数据。为了设计向研究人员推荐相关数据的系统,需要更好地理解研究人员如何搜索现有数据。这项研究将确定重新设计数据搜索系统以包括推荐的结果是否可以帮助社会科学家发现可有效重复使用的数据集。该项目的成果将帮助数据档案通过增加数据重用来确保我国在科学数据方面的投资回报,并将通过将研究人员与相关数据联系起来来促进科学进步。该项目将a)开发一个解释社会科学家目前如何搜索数据的人类信息行为模型,b)设计一个数据推荐系统原型,c)通过现场实验对该模型和系统进行评估。数据搜索与其他信息行为(如普通搜索)相比如何比较尚不清楚,这个项目将解释数据搜索是如何展开的。该项目还决定了在书籍和电影推荐等领域广受欢迎的推荐系统是否也能为数据工作并增加它们的重复使用。该奖项反映了NSF的法定使命,并通过使用基金会的智力优势和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(2)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
DataChat: Prototyping a Conversational Agent for Dataset Search and Visualization
DataChat:为数据集搜索和可视化构建对话代理原型
Direct, Orienting, and Scenic Paths: How Users Navigate Search in a Research Data Archive
直接、定向和风景路径:用户如何在研究数据档案中导航搜索
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Libby Hemphill其他文献

Tweet acts: how constituents lobby congress via Twitter
推文行为:选民如何通过 Twitter 游说国会
Crowdsourced reviews reveal substantial disparities in public perceptions of parking
众包评论显示公众对停车的看法存在巨大差异
  • DOI:
  • 发表时间:
    2024
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Lingyao Li;Songhua Hu;Ly Dinh;Libby Hemphill
  • 通讯作者:
    Libby Hemphill
Building bridges: A study of coordination in projects
搭建桥梁:项目协调研究
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Libby Hemphill
  • 通讯作者:
    Libby Hemphill
Feminism and social media research
女权主义和社交媒体研究
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Libby Hemphill;Ingrid Erickson;David Ribes;Ines Mergel
  • 通讯作者:
    Ines Mergel
Shaing Code Among Academic Researchers: Lessons Learned
在学术研究人员中分享代码:经验教训
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Carol E. Schmitz;Ameena Khan;Libby Hemphill
  • 通讯作者:
    Libby Hemphill

Libby Hemphill的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Libby Hemphill', 18)}}的其他基金

Developing Evidence-based Data Sharing and Archiving Policies
制定基于证据的数据共享和归档政策
  • 批准号:
    1930645
  • 财政年份:
    2019
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
FW-HTF-RM: Collaborative Research: Augmenting Social Media Content Moderation
FW-HTF-RM:协作研究:增强社交媒体内容审核
  • 批准号:
    1928434
  • 财政年份:
    2019
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
CyberTraining: CIU: Preparing the Public Sector Research Workforce to Impact Communities through Data Science
网络培训:CIU:让公共部门研究人员做好准备,通过数据科学影响社区
  • 批准号:
    1829724
  • 财政年份:
    2018
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
CHS: Small: Understanding and Designing Information Communication Technologies to Improve Communities
CHS:小型:理解和设计信息通信技术以改善社区
  • 批准号:
    1822228
  • 财政年份:
    2017
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
CHS: Small: Understanding and Designing Information Communication Technologies to Improve Communities
CHS:小型:理解和设计信息通信技术以改善社区
  • 批准号:
    1525662
  • 财政年份:
    2015
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant

相似国自然基金

Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    40 万元
  • 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
  • 批准号:
    61373035
  • 批准年份:
    2013
  • 资助金额:
    77.0 万元
  • 项目类别:
    面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
  • 批准号:
    31070748
  • 批准年份:
    2010
  • 资助金额:
    34.0 万元
  • 项目类别:
    面上项目
高维数据的函数型数据(functional data)分析方法
  • 批准号:
    11001084
  • 批准年份:
    2010
  • 资助金额:
    16.0 万元
  • 项目类别:
    青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
  • 批准号:
    31060015
  • 批准年份:
    2010
  • 资助金额:
    25.0 万元
  • 项目类别:
    地区科学基金项目
Computational Methods for Analyzing Toponome Data
  • 批准号:
    60601030
  • 批准年份:
    2006
  • 资助金额:
    17.0 万元
  • 项目类别:
    青年科学基金项目

相似海外基金

Data Driven Discovery of New Catalysts for Asymmetric Synthesis
数据驱动的不对称合成新催化剂的发现
  • 批准号:
    DP240100102
  • 财政年份:
    2024
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Discovery Projects
Towards knowledge discovery from imperfect and evolving data
从不完美和不断发展的数据中发现知识
  • 批准号:
    DP240103070
  • 财政年份:
    2024
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Discovery Projects
Data-enabled Pathways to Equity in Cyberinfrastructure Utilization for Scientific Discovery
利用数据实现科学发现的网络基础设施公平之路
  • 批准号:
    2346631
  • 财政年份:
    2024
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
From Data to Discovery: BlokBIO's Vision of Transforming Genomic Research with User-Centric Intelligence Solutions
从数据到发现:BlokBIO 通过以用户为中心的智能解决方案转变基因组研究的愿景
  • 批准号:
    10109374
  • 财政年份:
    2024
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Launchpad
Research Infrastructure: CC* Data Storage: Broadening UMBCs Data Storage footprint to Advance Scientific Research and Discovery
研究基础设施:CC* 数据存储:扩大 UMBC 数据存储足迹以推进科学研究和发现
  • 批准号:
    2346667
  • 财政年份:
    2024
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
From data to discovery in cancer immunology: AI-driven spatial transcriptomic.
从癌症免疫学的数据到发现:人工智能驱动的空间转录组学。
  • 批准号:
    24K15175
  • 财政年份:
    2024
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
GOALI: Frameworks: At-Scale Heterogeneous Data based Adaptive Development Platform for Machine-Learning Models for Material and Chemical Discovery
GOALI:框架:基于大规模异构数据的自适应开发平台,用于材料和化学发现的机器学习模型
  • 批准号:
    2311632
  • 财政年份:
    2023
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
Travel: Student Support for the 2023 ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD 2023)
旅行:2023 年 ACM SIGKDD 知识发现和数据挖掘会议 (KDD 2023) 的学生支持
  • 批准号:
    2323492
  • 财政年份:
    2023
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
Collaborative Research: DMREF: Data-Driven Discovery of the Processing Genome for Heterogenous Superalloy Microstructures
合作研究:DMREF:异质高温合金微结构加工基因组的数据驱动发现
  • 批准号:
    2323936
  • 财政年份:
    2023
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Standard Grant
CAREER: Statistically-Sound Knowledge Discovery from Data
职业:从数据中发现统计上合理的知识
  • 批准号:
    2238693
  • 财政年份:
    2023
  • 资助金额:
    $ 36.29万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了