Query-driven Data Acquisition from Web-based Data Sources
从基于 Web 的数据源进行查询驱动的数据采集
基本信息
- 批准号:EP/H017690/1
- 负责人:
- 金额:$ 63.59万
- 依托单位:
- 依托单位国家:英国
- 项目类别:Research Grant
- 财政年份:2010
- 资助国家:英国
- 起止时间:2010 至 无数据
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
The functioning of entities as diverse as enterprises and government agencies depends onobtaining high-quality data.Increasingly these entities depend on external sourcesfor their operational data: critical datais obtained dynamically via web services, is extracted from web pages,or is purchased from third parties. These sources can differ radicallyin their completeness, accuracy, and availability. It is not possible for applications to indexand explore data from each source in advance of querying:there are too many sources, they are too costly to access, and the data in themmay be refreshed constantly. How should data acquisition proceed in such situations?In this project we will develop algorithms for answering queries in the presence of large numbers ofweb-based data sources, sources that may overlap substantially in their datasetsbut have different access restrictions and costs. Our approach will make use of schema information about thedata an application is querying: data format, integrity constraints, and any prior knowledge of costs that maybe available. The core of the project will be algorithms for answering a query by interactively exploring the sources,dynamically pruning out irrelevant or exhausted sources in the process.
企业和政府机构等各种实体的运作取决于获得高质量的数据。这些实体越来越依赖外部来源获取其运营数据:关键数据是通过 Web 服务动态获取、从网页中提取或从第三方购买的。这些来源在完整性、准确性和可用性方面可能存在根本差异。应用程序不可能在查询之前对每个源的数据进行索引和探索:源太多,访问成本太高,并且其中的数据可能会不断刷新。在这种情况下应该如何进行数据采集?在这个项目中,我们将开发在存在大量基于网络的数据源的情况下回答查询的算法,这些数据源可能在其数据集中大量重叠,但具有不同的访问限制和成本。我们的方法将利用有关应用程序正在查询的数据的模式信息:数据格式、完整性约束以及可能可用的成本的任何先验知识。该项目的核心将是通过交互式探索源来回答查询的算法,在此过程中动态修剪掉不相关或耗尽的源。
项目成果
期刊论文数量(10)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Finite Open-World Query Answering with Number Restrictions
具有数量限制的有限开放世界查询应答
- DOI:10.1109/lics.2015.37
- 发表时间:2015
- 期刊:
- 影响因子:0
- 作者:Amarilli A
- 通讯作者:Amarilli A
The impact of virtual views on containment
虚拟视图对遏制的影响
- DOI:10.14778/1920841.1920882
- 发表时间:2010
- 期刊:
- 影响因子:2.5
- 作者:Benedikt M
- 通讯作者:Benedikt M
The complexity of higher-order queries
高阶查询的复杂度
- DOI:10.1016/j.ic.2015.07.003
- 发表时间:2015
- 期刊:
- 影响因子:1
- 作者:Benedikt M
- 通讯作者:Benedikt M
Some Model Theory of Guarded Negation
防护否定的一些模型理论
- DOI:10.48550/arxiv.2005.06299
- 发表时间:2020
- 期刊:
- 影响因子:0
- 作者:Barany V
- 通讯作者:Barany V
Two Variable vs. Linear Temporal Logic in Model Checking and Games
模型检查和博弈中的二变量与线性时态逻辑
- DOI:10.2168/lmcs-9(2:4)2013
- 发表时间:2013
- 期刊:
- 影响因子:0.6
- 作者:Benedikt M
- 通讯作者:Benedikt M
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Michael Benedikt其他文献
Form Filling Based on Constraint Solving
基于约束求解的表单填写
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
B. Spencer;Michael Benedikt;P. Senellart - 通讯作者:
P. Senellart
Monadic Datalog, Tree Validity, and Limited Access Containment
单子数据记录、树有效性和有限访问遏制
- DOI:
- 发表时间:
2019 - 期刊:
- 影响因子:0.5
- 作者:
Michael Benedikt;P. Bourhis;G. Gottlob;P. Senellart - 通讯作者:
P. Senellart
Verification of Two-Variable Logic Revisited
重新审视二变量逻辑的验证
- DOI:
- 发表时间:
2012 - 期刊:
- 影响因子:0
- 作者:
Michael Benedikt;R. Lenhardt;J. Worrell - 通讯作者:
J. Worrell
XPath leashed
XPath 束缚
- DOI:
10.1145/1456650.1456653 - 发表时间:
2009 - 期刊:
- 影响因子:0
- 作者:
Michael Benedikt;Christoph Koch - 通讯作者:
Christoph Koch
The FCC feasibility study
FCC 可行性研究
- DOI:
- 发表时间:
2023 - 期刊:
- 影响因子:0
- 作者:
Michael Benedikt;Frank Zimmermann - 通讯作者:
Frank Zimmermann
Michael Benedikt的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Michael Benedikt', 18)}}的其他基金
QUINTON -- QUerying and INTegrating Over Nested data
QUINTON——嵌套数据的查询和集成
- 批准号:
EP/T022124/1 - 财政年份:2021
- 资助金额:
$ 63.59万 - 项目类别:
Research Grant
PDQ: Proof-driven Query Planning
PDQ:证明驱动的查询规划
- 批准号:
EP/M005852/1 - 财政年份:2015
- 资助金额:
$ 63.59万 - 项目类别:
Fellowship
Enforcement of Constraints on XML Streams
对 XML 流实施约束
- 批准号:
EP/G004021/1 - 财政年份:2009
- 资助金额:
$ 63.59万 - 项目类别:
Research Grant
Describing and Perceiving Space in Architectural Environments
描述和感知建筑环境中的空间
- 批准号:
7817451 - 财政年份:1979
- 资助金额:
$ 63.59万 - 项目类别:
Standard Grant
相似国自然基金
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
基于Cache的远程计时攻击研究
- 批准号:60772082
- 批准年份:2007
- 资助金额:28.0 万元
- 项目类别:面上项目
相似海外基金
Facilitating circular construction practices in the UK: A data driven online marketplace for waste building materials
促进英国的循环建筑实践:数据驱动的废弃建筑材料在线市场
- 批准号:
10113920 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
SME Support
N2Vision+: A robot-enabled, data-driven machine vision tool for nitrogen diagnosis of arable soils
N2Vision:一种由机器人驱动、数据驱动的机器视觉工具,用于耕地土壤的氮诊断
- 批准号:
10091423 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Collaborative R&D
Data Driven Discovery of New Catalysts for Asymmetric Synthesis
数据驱动的不对称合成新催化剂的发现
- 批准号:
DP240100102 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Discovery Projects
PIDD-MSK: Physics-Informed Data-Driven Musculoskeletal Modelling
PIDD-MSK:物理信息数据驱动的肌肉骨骼建模
- 批准号:
EP/Y027930/1 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Fellowship
CC* Networking Infrastructure: YinzerNet: A Multi-Site Data and AI Driven Research Network
CC* 网络基础设施:YinzerNet:多站点数据和人工智能驱动的研究网络
- 批准号:
2346707 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Standard Grant
Collaborative Research: Data-Driven Elastic Shape Analysis with Topological Inconsistencies and Partial Matching Constraints
协作研究:具有拓扑不一致和部分匹配约束的数据驱动的弹性形状分析
- 批准号:
2402555 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Standard Grant
CAREER: Data-Driven Hardware and Software Techniques to Enable Sustainable Data Center Services
职业:数据驱动的硬件和软件技术,以实现可持续的数据中心服务
- 批准号:
2340042 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Continuing Grant
CAREER: A Universal Framework for Safety-Aware Data-Driven Control and Estimation
职业:安全意识数据驱动控制和估计的通用框架
- 批准号:
2340089 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Standard Grant
ERI: Data-Driven Analysis and Dynamic Modeling of Residential Power Demand Behavior: Using Long-Term Real-World Data from Rural Electric Systems
ERI:住宅电力需求行为的数据驱动分析和动态建模:使用农村电力系统的长期真实数据
- 批准号:
2301411 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Standard Grant
Collaborative Research: Data-driven engineering of the yeast Kluyveromyces marxianus for enhanced protein secretion
合作研究:马克斯克鲁维酵母的数据驱动工程,以增强蛋白质分泌
- 批准号:
2323984 - 财政年份:2024
- 资助金额:
$ 63.59万 - 项目类别:
Standard Grant














{{item.name}}会员




