AF: Small: Efficient Algorithms for Querying Noisy Distributed/Streaming Datasets
AF:小:查询嘈杂分布式/流数据集的高效算法
基本信息
- 批准号:1525024
- 负责人:
- 金额:$ 44.43万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-06-15 至 2019-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project aims to study the design of efficient query algorithms for noisy datasets in distributed and streaming applications. Noisy data is universal in today's world. Imprecise and varying references to the same real-world entities are ubiquitous in scientific and commercial databases. This noise poses significant obstructions to accurate data analytics. As an example of "noisy data," consider YouTube videos. YouTube tracks the views of individual videos. However, there are frequently many similar versions of the same event and answering a basic question such as "How many people viewed this event?" is challenging using current techniques. This project will provide new techniques and insights to combat the noisy nature of large datasets, and hence will enhance our ability to process the ever-increasing quantity of business and scientific data. The products of this project will be integrated into a trilogy of graduate and undergraduate courses on algorithms, databases, and data mining. The PI will disseminate research outcomes by giving talks at conferences/workshops, universities, industrial labs, as well as online media.More technically, this project tries to answer the following question: can we run distributed and streaming algorithms directly on the noisy datasets, resolve the noise "on the fly", and retain communication and space efficiency compared with the noise-free setting? The PI plans to study statistical, relational and graph problems. This project has the potential to impact a wide range of active research areas in theoretical computer science, including distributed and streaming algorithms, group testing, compressed sensing, communication complexity, clustering, and locality sensitive hashing.
本项目旨在研究分布式和流媒体应用中噪声数据集的高效查询算法设计。 噪声数据在当今世界是普遍存在的。在科学和商业数据库中,对同一真实世界实体的不精确和不同的引用无处不在。 这种噪音对准确的数据分析造成了重大障碍。 作为“噪声数据”的一个例子,考虑YouTube视频。YouTube会跟踪单个视频的浏览量。然而,同一事件经常有许多相似的版本,并回答一个基本问题,例如“有多少人观看了该事件?“使用当前的技术具有挑战性。 该项目将提供新的技术和见解来对抗大型数据集的噪声性质,从而提高我们处理不断增加的商业和科学数据的能力。该项目的产品将被整合到一个三部曲的研究生和本科生课程的算法,数据库和数据挖掘。PI将通过在会议/研讨会、大学、工业实验室以及在线媒体上发表演讲来传播研究成果。从技术上讲,该项目试图回答以下问题:我们是否可以直接在有噪声的数据集上运行分布式和流算法,解决“动态”噪声,并保持与无噪声环境相比的通信和空间效率? PI计划研究统计,关系和图形问题。 该项目有可能影响理论计算机科学中广泛的活跃研究领域,包括分布式和流式算法,组测试,压缩感知,通信复杂性,聚类和局部敏感哈希。
项目成果
期刊论文数量(8)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Distributed Statistical Estimation of Matrix Products with Applications
- DOI:10.1145/3196959.3196964
- 发表时间:2018-05
- 期刊:
- 影响因子:0
- 作者:David P. Woodruff;Qin Zhang
- 通讯作者:David P. Woodruff;Qin Zhang
Communication-Efficient Distributed Skyline Computation
- DOI:10.1145/3132847.3132927
- 发表时间:2017-11
- 期刊:
- 影响因子:0
- 作者:Haoyu Zhang;Qin Zhang
- 通讯作者:Haoyu Zhang;Qin Zhang
A Practical Algorithm for Distributed Clustering and Outlier Detection
- DOI:
- 发表时间:2018-05
- 期刊:
- 影响因子:0
- 作者:Jiecao Chen;Erfan Sadeqi Azer;Qin Zhang
- 通讯作者:Jiecao Chen;Erfan Sadeqi Azer;Qin Zhang
MinJoin: Efficient Edit Similarity Joins via Local Hash Minima
- DOI:10.1145/3292500.3330853
- 发表时间:2018-10
- 期刊:
- 影响因子:0
- 作者:Haoyu Zhang;Qin Zhang
- 通讯作者:Haoyu Zhang;Qin Zhang
Bias-Aware Sketches
- DOI:10.14778/3099622.3099627
- 发表时间:2016-10
- 期刊:
- 影响因子:0
- 作者:Jiecao Chen;Qin Zhang
- 通讯作者:Jiecao Chen;Qin Zhang
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Qin Zhang其他文献
Receptor activity‐modifying protein 1 regulates the phenotypic expression of BMSCs via the Hippo/Yap pathway
受体活性-修饰蛋白1通过Hippo/Yap途径调节BMSCs的表型表达
- DOI:
10.1002/jcp.28082 - 发表时间:
2019-08 - 期刊:
- 影响因子:0
- 作者:
Qin Zhang;Yanjun Guo;Hui Yu;Yufei Tang;Ying Yuan;Yixuan Jiang;Huilu Chen;Ping Gong;Lin Xiang - 通讯作者:
Lin Xiang
The gut microbiota modulator berberine ameliorates collagen-induced arthritis in rats by facilitating the generation of butyrate and adjusting the intestinal hypoxia and nitrate supply
肠道微生物群调节剂小檗碱通过促进丁酸盐的产生并调节肠道缺氧和硝酸盐的供应来改善大鼠胶原诱导的关节炎
- DOI:
10.1096/fj.201900425rr - 发表时间:
2019 - 期刊:
- 影响因子:0
- 作者:
Mengfan Yue;Yu Tao;Yulai Fang;Xingpan Lian;Qin Zhang;Yufeng Xia;Zhifeng Wei;Yue Dai - 通讯作者:
Yue Dai
用于工业系统故障诊断的动态不确定因果图的建模和概率推理方法
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:4.3
- 作者:
Chunling Dong;Qin Zhang - 通讯作者:
Qin Zhang
The lattice vibration and microwave dielectric properties of BaZnP 2− x Nb x O 7 ceramics for microwave substrates
微波基片BaZnP 2·x Nb x O 7 陶瓷的晶格振动和微波介电性能
- DOI:
10.1111/jace.18695 - 发表时间:
2022 - 期刊:
- 影响因子:3.9
- 作者:
Fangyi Huang;Hua Su;Qin Zhang;Xiao-Hui Wu;Yulan Jing;Yuanxun Li;Xiaoli Tang - 通讯作者:
Xiaoli Tang
Surface Modification of Colloidal Silica Nanoparticles: Controlling the size and Grafting Process
胶体二氧化硅纳米颗粒的表面改性:控制尺寸和接枝过程
- DOI:
10.5012/bkcs.2013.34.9.2747 - 发表时间:
2013-09 - 期刊:
- 影响因子:0
- 作者:
Lijuan Long;Shuhao Qin;Jie Yu;Qin Zhang - 通讯作者:
Qin Zhang
Qin Zhang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Qin Zhang', 18)}}的其他基金
Collaborative Research: AF: Small: Parallel Reinforcement Learning with Communication and Adaptivity Constraints
协作研究:AF:小型:具有通信和适应性约束的并行强化学习
- 批准号:
2006591 - 财政年份:2020
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
CAREER:Foundation of Communication-Efficient Distributed Computation and Monitoring
职业:通信高效的分布式计算和监控的基础
- 批准号:
1844234 - 财政年份:2019
- 资助金额:
$ 44.43万 - 项目类别:
Continuing Grant
BIGDATA: Collaborative Research: F: Efficient Distributed Computation of Large-Scale Graph Problems in Epidemiology and Contagion Dynamics
BIGDATA:协作研究:F:流行病学和传染动力学中大规模图问题的高效分布式计算
- 批准号:
1633215 - 财政年份:2016
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
AF: Small: Redundancy exploiting algorithms for high throughput genomics
AF:小:利用冗余算法实现高通量基因组学
- 批准号:
1619081 - 财政年份:2016
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: NSF-AoF: CIF: AF: Small: Energy-Efficient THz Communications Across Massive Dimensions
合作研究:NSF-AoF:CIF:AF:小型:大尺寸的节能太赫兹通信
- 批准号:
2225576 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Efficient Algorithms for Optimal Transport in Geometric Settings
合作研究:AF:小:几何设置中最佳传输的高效算法
- 批准号:
2223871 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Efficient Massively Parallel Algorithms
合作研究:AF:小型:高效大规模并行算法
- 批准号:
2218677 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Efficient Algorithms for Optimal Transport in Geometric Settings
合作研究:AF:小:几何设置中最佳传输的高效算法
- 批准号:
2223870 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
AF: Small: Efficient Representation of Large Networks
AF:小型:大型网络的高效表示
- 批准号:
2153680 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Collaborative Research: NSF-AoF: CIF: AF: Small: Energy-Efficient THz Communications Across Massive Dimensions
合作研究:NSF-AoF:CIF:AF:小型:大尺寸的节能太赫兹通信
- 批准号:
2225575 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: Efficient Massively Parallel Algorithms
合作研究:AF:小型:高效大规模并行算法
- 批准号:
2218678 - 财政年份:2022
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
AF: RI: Small: Computationally Efficient Approximation of Stationary Points in Convex and Min-Max Optimization
AF:RI:小:凸和最小-最大优化中驻点的计算高效近似
- 批准号:
2007757 - 财政年份:2020
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
AF: Small: High-dimensional geometry and probability for efficient inference
AF:小:高维几何和概率以实现高效推理
- 批准号:
2006994 - 财政年份:2020
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant
NSF-BSF: AF: Small: Efficient Algorithms for Multi-Robot Multi-Criteria Optimal Motion Planning
NSF-BSF:AF:小型:多机器人多标准最佳运动规划的高效算法
- 批准号:
2007556 - 财政年份:2020
- 资助金额:
$ 44.43万 - 项目类别:
Standard Grant