III: Small: Increasing the Value of Existing Web Archives

III:小:增加现有网络档案的价值

基本信息

项目摘要

Web archiving is a thriving activity, but remains at the fringes of the larger web community. Web archiving often runs into two opinions: (1) who cares about the past? and (2) hasn't the Internet Archive solved this already? While the Internet Archive is the cornerstone of web archiving, there remains much work to be done to align archiving with the larger web community. The PIs will investigate a collection of methods and concepts to accelerate the adoption and utility of web archives. While there are more than a dozen publicly available web archives (including the Internet Archive) that are simultaneously accessible via the Memento protocol, these archives are mostly underutilized because they lack the APIs and services to be of greater immediate use to the live web. For example, rather than returning "HTTP 404" responses for pages that are not archived, the archives can introspect on their collections for replacement or similar pages. This project will research: (1) extended APIs for archives; (2) models and methods for archival quality; and (3) user tools and techniques for exploring and understanding temporality on the web. The broader impacts of this research will include increasing the ability of archives to record today's social discourse, which primarily occurs on the web, oftentimes with print or TV as secondary. The ability to publish data on the web far outstrips the ability to archive it for posterity. There are a number of public web archives that are doing yeoman's work saving as much material as they can, but saving is only a precondition for later use. Mostly these archived web pages are being underutilized, only because the tools for extracting the value from these archives are lacking. This project will research and build the tools, infrastructure, and methods to better utilize, understand, and interact with the archived materials that we already have.Aside from their crawling, archives are mostly passive collections of content that offer little in the way of services other than answering "yes" or "no" to a request for an archived page. Even with the increased rate of archiving (and a greater number of active web archives), there is little analysis on the web archives to provide better services for incoming requests. The PIs will build on their prior API work to explore recommendation services for web pages, where even if an archive does not have the requested web page it can make recommendations for a replacement page based on content and link analysis. This will prevent the web archives from being a dead end if they do not have the requested page. The PIs will also perform fundamental research on the issue of the quality of the reconstructed page, a topic that has been mostly ignored. In particular the PIs are concerned with detecting and resolving "temporal violations," combinations of HTML pages with embedded resources that are presented to the user as an historical page but in fact they never existed in that combination on the live web. This occurs in at least 5% of the pages replayed through the Internet Archive. The other aspect of quality research deals with automatically assessing how damaged an archived page is with respect to its missing embedded resources. Straight percentages (e.g., this page is missing 3 of 57 embedded resources) do not tell the whole tale, but there are automated methods that can be used to estimate how important the resource was (even though you do not have it) to the rendered page. This will allow large-scale assessment not only of pages, but of archive-wide performance for comparable time periods. Lastly, the PIs will focus on tools and methods for allowing users to better understand and interact with the archived web and temporal concepts in general. Users' understanding of temporal concepts is not well advanced, in part because the tools are not in place to allow them to better understand and build models for interaction. For further information see the web site at: http://ws-dl.cs.odu.edu/.
网络存档是一项蓬勃发展的活动,但仍然处于更大的网络社区的边缘。 网络存档通常会遇到两种观点:(1)谁在乎过去? (2)互联网档案馆不是已经解决了这个问题吗? 虽然互联网档案馆是网络存档的基石,但要使存档与更大的网络社区保持一致,仍有许多工作要做。 PI将调查一系列方法和概念,以加速Web存档的采用和实用性。 虽然有十几个公开的网络档案(包括互联网档案馆)可以通过Memento协议同时访问,但这些档案大多未得到充分利用,因为它们缺乏API和服务,无法立即用于实时网络。 例如,对于未存档的页面,不是返回“HTTP 404”响应,而是存档可以对它们的集合进行自省,以找到替换或类似的页面。 该项目将研究:(1)档案的扩展API;(2)档案质量的模型和方法;(3)探索和理解网络时间性的用户工具和技术。 这项研究的更广泛影响将包括提高档案馆记录当今社会话语的能力,这些话语主要发生在网络上,通常是印刷品或电视作为次要内容。在网络上发布数据的能力远远超过了为子孙后代存档数据的能力。有许多公共网络档案馆正在尽可能多地保存材料,但保存只是以后使用的先决条件。大多数情况下,这些存档的网页没有得到充分利用,只是因为缺乏从这些档案中提取价值的工具。该项目将研究和构建工具、基础设施和方法,以更好地利用、理解和与我们已经拥有的存档材料进行交互。除了抓取之外,存档大多是被动的内容集合,除了回答“是”或“否”之外,几乎没有提供任何服务。即使存档率提高(活跃的网络档案数量增加),也很少对网络档案进行分析,以便为收到的请求提供更好的服务。 PI将建立在他们之前的API工作基础上,探索网页推荐服务,即使存档没有所请求的网页,它也可以根据内容和链接分析为替换页面提供建议。 这将防止网络档案是一个死胡同,如果他们没有所请求的页面。 PI还将对重建页面的质量问题进行基础研究,这是一个大多被忽视的话题。PI特别关注检测和解决“时间违规”,即HTML页面与嵌入式资源的组合,这些资源作为历史页面呈现给用户,但实际上它们从未存在于实时Web上的组合中。通过互联网档案馆重播的页面中至少有5%发生这种情况。质量研究的另一个方面涉及自动评估存档页面的损坏程度与其丢失的嵌入式资源有关。 直接百分比(例如,这个页面缺少了57个嵌入资源中的3个)并不能说明全部情况,但是有一些自动化的方法可以用来估计资源对呈现的页面的重要性(即使你没有它)。这将使人们能够不仅对网页进行大规模评估,而且对可比时期的整个档案的业绩进行大规模评估。最后,PI将侧重于工具和方法,使用户能够更好地理解和与存档的网络和一般的时间概念互动。 用户对时间概念的理解还不够深入,部分原因是工具还不到位,无法让他们更好地理解和构建交互模型。欲了解更多信息,请访问网站:http://ws-dl.cs.odu.edu/。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Michael Nelson其他文献

Anopheline Vectors of Human Plasmodia
人类疟原虫的按蚊载体
  • DOI:
  • 发表时间:
    1993
  • 期刊:
  • 影响因子:
    0
  • 作者:
    D. Bown;Michael Nelson
  • 通讯作者:
    Michael Nelson
School food in England: Are we getting it right?
英国的学校伙食:我们做得对吗?
  • DOI:
    10.1111/nbu.12072
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    3.3
  • 作者:
    Michael Nelson
  • 通讯作者:
    Michael Nelson
SVD-Based Ghost Circuitry Detection
基于 SVD 的幽灵电路检测
  • DOI:
    10.1007/978-3-642-04431-1_16
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michael Nelson;A. Nahapetian;F. Koushanfar;M. Potkonjak
  • 通讯作者:
    M. Potkonjak
Long-Term Dynamics of the LTER Program: Evolving Definitions and Composition
LTER 计划的长期动态:不断变化的定义和构成
  • DOI:
  • 发表时间:
    2021
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Julia A. Jones;Michael Nelson
  • 通讯作者:
    Michael Nelson
EFFECTS OF POSTURAL STRESS ON LEFT ATRIAL FUNCTION IN HEALTHY SUBJECTS USING SPECKLE TRACKING IMAGING
  • DOI:
    10.1016/s0735-1097(11)60868-1
  • 发表时间:
    2011-04-05
  • 期刊:
  • 影响因子:
  • 作者:
    Luis A. Altamirano-Diaz;Michael Nelson;Mark Haykowsky;Lori West;Nee Scze Khoo
  • 通讯作者:
    Nee Scze Khoo

Michael Nelson的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Michael Nelson', 18)}}的其他基金

RAPID: Collaborative Research: COVID-19, Crises, and Support for the Rule of Law
RAPID:合作研究:COVID-19、危机和对法治的支持
  • 批准号:
    2027671
  • 财政年份:
    2020
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
Collaborative Research: Judicial Legitimacy in Comparative Perspective
合作研究:比较视角下的司法合法性
  • 批准号:
    1920915
  • 财政年份:
    2019
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
Doctoral Dissertation Research in DRMS: Donation appeals for conservation - the influence of moral worldviews and moral foundations
DRMS 博士论文研究:捐赠呼吁保护——道德世界观和道德基础的影响
  • 批准号:
    1725530
  • 财政年份:
    2017
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
Collaborative Research: Testing Models of Representation and Institutional Design in the State Courts' Consideration of Inequality
合作研究:测试州法院考虑不平等时的代表性和制度设计模型
  • 批准号:
    1456580
  • 财政年份:
    2015
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
Long-Term Ecological Research at the H.J. Andrews Experimental Forest (LTER7)
H.J. 安德鲁斯实验森林 (LTER7) 的长期生态研究
  • 批准号:
    1440409
  • 财政年份:
    2014
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Continuing Grant
Doctoral Consortium at 2012 ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL 2012)
2012 年 ACM/IEEE-CS 数字图书馆联合会议博士联盟 (JCDL 2012)
  • 批准号:
    1239821
  • 财政年份:
    2012
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
III: Large: Collaborative Research: Web Archive Cooperative
III:大型:协作研究:网络档案合作社
  • 批准号:
    1009392
  • 财政年份:
    2010
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
Long-Term Ecological Research at the H.J. Andrews Experimental Forest (LTER6)
H.J. 安德鲁斯实验森林 (LTER6) 的长期生态研究
  • 批准号:
    0823380
  • 财政年份:
    2008
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Continuing Grant
CAREER: Self-Preserving Digital Objects
职业:自我保护的数字对象
  • 批准号:
    0643784
  • 财政年份:
    2007
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Continuing Grant
SGER: In Vivo Digital Preservation
SGER:体内数字保存
  • 批准号:
    0610841
  • 财政年份:
    2006
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

FET: Small: Increasing Robustness, Efficacy, and Capability of CMOS-Compatible Electronic Ising Machines
FET:小型:提高 CMOS 兼容电子发射机的鲁棒性、效率和能力
  • 批准号:
    2233378
  • 财政年份:
    2023
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
SaTC: NSF-BSF: CORE: Small: Increasing Users' Cyber-Security Compliance by Reducing Present Bias
SaTC:NSF-BSF:核心:小型:通过减少当前偏差来提高用户的网络安全合规性
  • 批准号:
    1817249
  • 财政年份:
    2018
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
Sustainable Energy: Increasing the Hosting Capacity of Renewable Energy Systems with Small Modular Reactors********
可持续能源:利用小型模块化反应堆提高可再生能源系统的托管能力********
  • 批准号:
    537471-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Engage Grants Program
CHS: Small: Collaborative Research: Increasing Social Connectedness in Telerobotic Platforms Through Adding Gesture Capabilities
CHS:小型:协作研究:通过添加手势功能增强远程机器人平台的社交联系
  • 批准号:
    1618926
  • 财政年份:
    2017
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
CHS: Small: Collaborative Research: Increasing Social Connectedness in Telerobotic Platforms Through Adding Gesture Capabilities
CHS:小型:协作研究:通过添加手势功能增强远程机器人平台的社交联系
  • 批准号:
    1618283
  • 财政年份:
    2017
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
The Problem and that Solution in Patent Strategy of Small and Medium Scale Enterprises in Japan which Increasing the Production Ratio in Foreign Countries
日本中小企业提高国外生产比例的专利战略问题及对策
  • 批准号:
    23530516
  • 财政年份:
    2011
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
TC: Small: Increasing The Cost of Malware
TC:小:增加恶意软件的成本
  • 批准号:
    1017034
  • 财政年份:
    2010
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Continuing Grant
STTR Phase I: Increasing the Efficiency of Membrane Filtration for Drinking Water Purification through the Incorporation of Novel Anti-Biofilm Small Molecules
STTR 第一阶段:通过掺入新型抗生物膜小分子提高饮用水净化膜过滤的效率
  • 批准号:
    0930480
  • 财政年份:
    2009
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Standard Grant
Increasing research productivity through the year at a small university
小型大学全年研究生产力的提高
  • 批准号:
    310817-2004
  • 财政年份:
    2009
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Research Capacity Development in Small Universities
Increasing research productivity through the year at a small university
小型大学全年研究生产力的提高
  • 批准号:
    310817-2004
  • 财政年份:
    2008
  • 资助金额:
    $ 48.18万
  • 项目类别:
    Research Capacity Development in Small Universities
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了