Improving Data Quality in Protected and Dynamic Data Environments
提高受保护的动态数据环境中的数据质量
基本信息
- 批准号:435477-2013
- 负责人:
- 金额:$ 1.46万
- 依托单位:
- 依托单位国家:加拿大
- 项目类别:Discovery Grants Program - Individual
- 财政年份:2019
- 资助国家:加拿大
- 起止时间:2019-01-01 至 2020-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Poor data quality is a mainstream issue for organizations, and is a pervasive problem in databases, datawarehousing, and Web data. Many data processing tasks such as information integration, information retrieval, and recent initiatives such as Big Data analysis, require various forms of data preparation that assume the data conforms to ideal data distributions. In reality however, this is not often the case. Real data often contains erroneous, incomplete, and inconsistent values. These inconsistencies are magnified by the increasingly large, heterogeneous, and dynamic datasets available today. In order for tools and applications to glean insights from this data, the ability to handle uncertainties and inconsistencies in the data is crucial for building high quality data stores. My work to date has focused on developing techniques that resolve inconsistencies by performing repairs to the data or to the violated constraints in static data environments. In the proposed work, I will study transformative solutions to address the increased need for dynamic, privacy aware data cleaning. Given the increasing size of data stores, and the proliferation of personal data available in modern datasets, my goal is to understand and develop techniques for online data cleaning, while respecting the privacy policies of the data. The proposed techniques will be applicable in organizational and online settings where there may be restricted access to portions of the data, but global data cleaning solutions are required. That is, given limited views of the data, my goal is to find repairs which resolve the inconsistencies, with respect to the full view of the data, by sharing the private information in an obfuscated manner. This work aligns with privacy aware Big Data initiatives, and contributes towards the goal of automated data quality management.
数据质量差是组织的主流问题,也是数据库、数据仓库和Web数据中普遍存在的问题。许多数据处理任务,如信息集成,信息检索,以及最近的举措,如大数据分析,需要各种形式的数据准备,假设数据符合理想的数据分布。然而,在现实中,情况并非如此。真实的数据通常包含错误、不完整和不一致的值。这些不一致性被当今日益庞大、异构和动态的数据集放大。 为了让工具和应用程序从这些数据中收集见解,处理数据中的不确定性和不一致性的能力对于构建高质量的数据存储至关重要。 到目前为止,我的工作主要集中在开发技术,通过对静态数据环境中的数据或违反的约束进行修复来解决不一致性。 在拟议的工作中,我将研究变革性的解决方案,以满足对动态、隐私感知数据清理的日益增长的需求。 考虑到数据存储的规模越来越大,以及现代数据集中可用的个人数据的激增,我的目标是了解和开发在线数据清洗技术,同时尊重数据的隐私政策。 拟议的技术将适用于组织和在线设置,其中可能存在对部分数据的限制访问,但需要全局数据清理解决方案。也就是说,鉴于数据的视图有限,我的目标是通过以模糊的方式共享私有信息,找到解决数据完整视图不一致的修复方法。 这项工作与隐私意识大数据计划保持一致,并有助于实现自动化数据质量管理的目标。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Chiang, Fei其他文献
InfoClean: Protecting Sensitive Information in Data Cleaning
- DOI:
10.1145/3190577 - 发表时间:
2018-05-01 - 期刊:
- 影响因子:2.1
- 作者:
Chiang, Fei;Gairola, Dhruv - 通讯作者:
Gairola, Dhruv
A decision integration strategy for short-term demand forecasting and ordering for red blood cell components
- DOI:
10.1016/j.orhc.2021.100290 - 发表时间:
2021-03-08 - 期刊:
- 影响因子:2.1
- 作者:
Li, Na;Chiang, Fei;Heddle, Nancy M. - 通讯作者:
Heddle, Nancy M.
Chiang, Fei的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Chiang, Fei', 18)}}的其他基金
Looking Back to Look Forward: Explaining and Exploring Changes in Data
回顾过去展望未来:解释和探索数据的变化
- 批准号:
RGPIN-2020-05711 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Looking Back to Look Forward: Explaining and Exploring Changes in Data
回顾过去展望未来:解释和探索数据的变化
- 批准号:
RGPIN-2020-05711 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Looking Back to Look Forward: Explaining and Exploring Changes in Data
回顾过去展望未来:解释和探索数据的变化
- 批准号:
RGPIN-2020-05711 - 财政年份:2020
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
相似国自然基金
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
- 批准号:
- 批准年份:2020
- 资助金额:40 万元
- 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
- 批准号:61373035
- 批准年份:2013
- 资助金额:77.0 万元
- 项目类别:面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
- 批准号:31070748
- 批准年份:2010
- 资助金额:34.0 万元
- 项目类别:面上项目
高维数据的函数型数据(functional data)分析方法
- 批准号:11001084
- 批准年份:2010
- 资助金额:16.0 万元
- 项目类别:青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
- 批准号:31060015
- 批准年份:2010
- 资助金额:25.0 万元
- 项目类别:地区科学基金项目
Computational Methods for Analyzing Toponome Data
- 批准号:60601030
- 批准年份:2006
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
相似海外基金
Improving Users' Access to Quality Data
改善用户对高质量数据的访问
- 批准号:
RGPIN-2021-04120 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Improving health data quality by assessing and enhancing semantic integrity
通过评估和增强语义完整性来提高健康数据质量
- 批准号:
10446586 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Improving health data quality by assessing and enhancing semantic integrity
通过评估和增强语义完整性来提高健康数据质量
- 批准号:
10651693 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
QUAREP-LiMi. Development of quality control tools and methodologies for light microscopy: improving image data quality, reliability & reproducibility.
QUAREP-LiMi。
- 批准号:
MR/W020793/1 - 财政年份:2022
- 资助金额:
$ 1.46万 - 项目类别:
Research Grant
EAGER: Improving the Data Quality of Measurements Collected with Drone-Mounted Sensors: A Fluid Dynamics Perspective with Guidelines for Optimum Sensor Placement and Housing
EAGER:提高无人机安装传感器收集的测量数据质量:流体动力学视角以及最佳传感器放置和外壳指南
- 批准号:
2125997 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Standard Grant
Improving Users' Access to Quality Data
改善用户对高质量数据的访问
- 批准号:
RGPIN-2021-04120 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Grants Program - Individual
Improving Users' Access to Quality Data
改善用户对高质量数据的访问
- 批准号:
DGECR-2021-00447 - 财政年份:2021
- 资助金额:
$ 1.46万 - 项目类别:
Discovery Launch Supplement
Analytical tools to utilize livestock big data for improving meat quality
利用牲畜大数据改善肉类质量的分析工具
- 批准号:
20K06383 - 财政年份:2020
- 资助金额:
$ 1.46万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
EAGER: Improving the Quality and Reducing the Burden of Producing and Reusing Publicly Accessible Research Data
EAGER:提高可公开访问的研究数据的质量并减轻其负担
- 批准号:
2039677 - 财政年份:2020
- 资助金额:
$ 1.46万 - 项目类别:
Standard Grant
Improving Data Quality of Advanced LIGO Gravitational-Wave Searches
提高先进 LIGO 引力波搜索的数据质量
- 批准号:
1921006 - 财政年份:2019
- 资助金额:
$ 1.46万 - 项目类别:
Continuing Grant