III: Small: Query and Goal Driven Entity Resolution Framework

III:小型:查询和目标驱动的实体解析框架

基本信息

  • 批准号:
    1118114
  • 负责人:
  • 金额:
    $ 50万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    2011
  • 资助国家:
    美国
  • 起止时间:
    2011-08-01 至 2015-12-31
  • 项目状态:
    已结题

项目摘要

Data cleaning technologies, traditionally designed to improve quality of data in back-end data warehouses, are fast emerging as a vital component of real-time information access. As the Web evolves towards supporting interactive analytics and basic search migrates from simple keyword retrieval to retrieval based on semantically richer concepts (e.g., entities) extracted from web pages, the need for "on-the-fly" cleaning techniques that can help alleviate data quality challenges is rapidly increasing. This project explores three new innovations that will help advance data cleaning towards becoming an embedded enabling technology for real-time information access. The first innovation is "query-aware data cleaning" which is based on the observation that the specificity of the real-time task such as a query can be exploited significantly to bring new optimizations to the data cleaning process. The second innovation is a data cleaning framework that migrates from the "best-effort" adhoc setup of today's systems into a principled approach that exposes and exploits a fundamental tradeoff between the cost of cleaning and quality of results achieved. Finally, since results of cleaning need to be fed to the end-user or analysis code, the proposal postulates and addresses approaches towards how results processed through data cleaning code can be presented to the end-recipient. The primary contribution is mechanisms to hide the uncertainty in the data and determinize the results while maximizing the end application goals. The proposed research is intended to bring transformative improvements in interactive analytics and search on the web by facilitating real-time data cleaning and data quality enhancements. The project also aims to benefit the research community by incorporating mechanisms developed as part of this research into the Web People Search Technology (WEST), enabling WEST to become a real-time on-the-fly web people search tool. The goal is to support WEST as a plug-and-play system wherein other researchers could embed and test their data cleaning algorithms and tools. Finally, the planned research, system development, and educational activities are going to significantly enhance the educational experience of students, preparing them for a brighter future in the today's knowledge driven society.For further information see the project web site at the URL: http://sherlock.ics.uci.edu
传统上用于提高后端数据仓库中数据质量的数据清洗技术正迅速成为实时信息访问的重要组成部分。随着Web朝着支持交互式分析和基本搜索的方向发展,从简单的关键字检索迁移到基于语义上更丰富的概念(例如,实体),对能够帮助减轻数据质量挑战的“即时”清理技术的需求正在迅速增加。该项目探索了三项新的创新,这些创新将有助于推进数据清洗,使其成为实时信息访问的嵌入式支持技术。第一个创新是“查询感知数据清理”,它基于这样的观察,即可以显著地利用诸如查询之类的实时任务的特异性来为数据清理过程带来新的优化。第二个创新是一个数据清理框架,它从当今系统的“尽力而为”临时设置迁移到一个原则性的方法,该方法暴露并利用了清理成本和所获得结果质量之间的基本权衡。最后,由于清洗结果需要提供给最终用户或分析代码,该提案假定并解决了如何将通过数据清洗代码处理的结果呈现给最终接收者的方法。主要贡献是隐藏数据中的不确定性并确定结果的机制,同时最大限度地提高最终应用程序的目标。拟议的研究旨在通过促进实时数据清理和数据质量增强,为网络上的交互式分析和搜索带来变革性的改进。该项目还旨在通过将作为本研究一部分开发的机制整合到网络人物搜索技术(WEST)中,使WEST成为实时动态网络人物搜索工具,从而使研究界受益。我们的目标是支持WEST作为一个即插即用的系统,其他研究人员可以嵌入和测试他们的数据清理算法和工具。最后,计划中的研究、系统开发和教育活动将显著增强学生的教育体验,为他们在当今知识驱动的社会中创造更光明的未来做好准备。http://sherlock.ics.uci.edu

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Sharad Mehrotra其他文献

Obscure: Information-Theoretically Secure, Oblivious, and Verifiable Aggregation Queries
晦涩难懂:信息理论上安全、不经意且可验证的聚合查询
Dimensionality Reduction for Fast Similarity Search in Large Time Series Databases
  • DOI:
    10.1007/pl00011669
  • 发表时间:
    2001-08-01
  • 期刊:
  • 影响因子:
    3.100
  • 作者:
    Eamonn Keogh;Kaushik Chakrabarti;Michael Pazzani;Sharad Mehrotra
  • 通讯作者:
    Sharad Mehrotra

Sharad Mehrotra的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Sharad Mehrotra', 18)}}的其他基金

Travel: Request for Student Travel Support for the 48th International Conference on Very Large Databases 2022
旅行:请求 2022 年第 48 届超大型数据库国际会议的学生旅行支持
  • 批准号:
    2230342
  • 财政年份:
    2022
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
RAPID: An Organizational Scale Approach to Privacy-Enabled Contact Tracing in COVID-19
RAPID:在 COVID-19 中启用隐私的组织规模接触者追踪方法
  • 批准号:
    2032525
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: EnrichDB - Supporting Enrichment in Database Systems
III:小:EnrichDB - 支持数据库系统的丰富
  • 批准号:
    2008993
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Student Support for the 46th International Conference on Very Large Databases (VLDB 2020)
第 46 届超大型数据库国际会议 (VLDB 2020) 的学生支持
  • 批准号:
    2025108
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
Student Support for the 44th International Conference on Very Large Databases (VLDB 2018)
第 44 届超大型数据库国际会议 (VLDB 2018) 的学生支持
  • 批准号:
    1835996
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CPS: Synergy: Collaborative Research: Extracting Time-Critical Situational Awareness from Resource Constrained Networks
CPS:协同:协作研究:从资源受限的网络中提取时间关键的态势感知
  • 批准号:
    1545071
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Linking and Resolving Entities in Big Data
III:小:大数据中实体的链接和解析
  • 批准号:
    1527536
  • 财政年份:
    2015
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
CSR: Large: Collaborative Research: Enabling Privacy-Utility Trade-Offs in Pervasive Computing Systems
CSR:大型:协作研究:在普适计算系统中实现隐私与效用的权衡
  • 批准号:
    1212943
  • 财政年份:
    2012
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
TC: Small: Risk Aware Query Processing in Mixed Security Database Environments
TC:小型:混合安全数据库环境中的风险感知查询处理
  • 批准号:
    1118127
  • 财政年份:
    2011
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
II-EN: UCI Irvine Sensorium
II-EN:UCI 欧文传感器中心
  • 批准号:
    1059436
  • 财政年份:
    2011
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

III: Small: Query-By-Sketch: Simplifying Video Clip Retrieval Through A Visual Query Paradigm
III:小:按草图查询:通过可视化查询范式简化视频剪辑检索
  • 批准号:
    2335881
  • 财政年份:
    2024
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: RUI: Designing Structure-Phenotype Query-Retrieval and Analysis Systems for Microscopy-Based Whole Organism Studies
III:小:RUI:为基于显微镜的整个生物体研究设计结构表型查询检索和分析系统
  • 批准号:
    2401096
  • 财政年份:
    2023
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Bringing database query optimization to data intensive applications
III:小型:将数据库查询优化引入数据密集型应用程序
  • 批准号:
    2008295
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: COMPASS: Online Sketch-based Query Optimization for In-Memory Databases
III:小:COMPASS:内存数据库基于草图的在线查询优化
  • 批准号:
    2008815
  • 财政年份:
    2020
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Native Compilation, Query Processing, and Indexing for In-memory Graph Relational Data Systems
III:小:内存图关系数据系统的本机编译、查询处理和索引
  • 批准号:
    1910216
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: A Query System for Rapid Audiovisual Analysis of Large-Scale Video Collections
三:小型:大规模视频采集快速视听分析的查询系统
  • 批准号:
    1908727
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: Regret-Bounded Query Evaluation via Reinforcement Learning
III:小:通过强化学习进行遗憾限制查询评估
  • 批准号:
    1910830
  • 财政年份:
    2019
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
III: Small: RUI: Designing Structure-Phenotype Query-Retrieval and Analysis Systems for Microscopy-Based Whole Organism Studies
III:小:RUI:为基于显微镜的整个生物体研究设计结构表型查询检索和分析系统
  • 批准号:
    1817239
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: In-memory, Distributed, and Adaptive Spatio-textual Query Processing
III:小型:内存中、分布式和自适应空间文本查询处理
  • 批准号:
    1815796
  • 财政年份:
    2018
  • 资助金额:
    $ 50万
  • 项目类别:
    Standard Grant
III: Small: Non-Invasive Real-Time Analytics in Database Systems using Holistic Query Compilation
III:小型:使用整体查询编译在数据库系统中进行非侵入式实时分析
  • 批准号:
    1718582
  • 财政年份:
    2017
  • 资助金额:
    $ 50万
  • 项目类别:
    Continuing Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了