CRII: III: Scalable Noise-filtering and Community Queries on User-generated Data

CRII:III:可扩展的噪声过滤和对用户生成数据的社区查询

基本信息

  • 批准号:
    1849971
  • 负责人:
  • 金额:
    $ 17.49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-08-15 至 2022-07-31
  • 项目状态:
    已结题

项目摘要

This project investigates novel indexing and querying techniques that enable scientists to analyze and extract meaningful data from large repositories of user-generated data. The need for such techniques is significant, especially for user-generated social media data, which is the major repository of user-generated data and the largest archived and real-time source of human behavior and information. Thus, scientists are widely using this data in disciplines as disparate as sociology, behavioral sciences, education, spatial sciences, food sciences, medical studies, and political sciences. This project focuses on innovative indexing and querying techniques to enable scientists to effectively exploit user-generated data at a large scale.The planned research adds new data management infrastructure modules to support: (1) Scalable noise filtering queries, a subset of selection queries that are needed repeatedly and are expressed in SQL-based systems as multiple nested queries, which is not efficient for large datasets. To support this, the project investigates techniques for: (a) Advanced query conjunctions, e.g., BUT-NOT and EITHER-XOR, to scale up complex-predicate queries beyond basic search queries that are currently supported in data management systems. (b) Scalable contextual scoring of data records, e.g., based on sentiment or semantics, so irrelevant records are pruned early and the search space is downsized significantly. (2) Scalable community-centric queries that enables scientists to ask queries about communities with large numbers of users while having real-time query response beyond what is currently supported by graph data management technology. The project investigates indexing, query processing, and storage optimization techniques that scale up such queries at a system-level.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
该项目研究了新的索引和查询技术,使科学家能够从大量用户生成的数据中分析和提取有意义的数据。对这种技术的需求是巨大的,特别是对于用户生成的社交媒体数据,这是用户生成数据的主要存储库,也是人类行为和信息的最大存档和实时来源。因此,科学家们在社会学、行为科学、教育学、空间科学、食品科学、医学研究和政治学等不同学科中广泛使用这些数据。该项目侧重于创新索引和查询技术,使科学家能够有效地大规模利用用户生成的数据。计划中的研究增加了新的数据管理基础架构模块来支持:(1)可扩展的噪声过滤查询,这是重复需要的选择查询的子集,在基于sql的系统中表示为多个嵌套查询,这对于大型数据集来说效率不高。为了支持这一点,该项目研究了以下技术:(a)高级查询连词,例如,BUT-NOT和EITHER-XOR,以扩展复杂谓词查询,超出当前数据管理系统支持的基本搜索查询。(b)可扩展的数据记录上下文评分,例如,基于情感或语义,因此不相关的记录被提前修剪,搜索空间显着缩小。(2)可扩展的以社区为中心的查询,使科学家能够查询拥有大量用户的社区,同时具有超越当前图形数据管理技术所支持的实时查询响应。该项目研究在系统级扩展此类查询的索引、查询处理和存储优化技术。该奖项反映了美国国家科学基金会的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(22)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Towards A Unified Framework for Event Detection Applications
迈向事件检测应用程序的统一框架
DiReCT: Disaster Response Coordination with Trusted Volunteers
DiReCT:与值得信赖的志愿者进行灾难响应协调
Spatio-temporal analysis of meta-data semantics of market shares over large public geosocial media data
大型公共地理社交媒体数据市场份额元数据语义的时空分析
  • DOI:
    10.1080/17489725.2018.1547428
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    2.3
  • 作者:
    Almaslukh, Abdulaziz;Magdy, Amr;Rey, Sergio J.
  • 通讯作者:
    Rey, Sergio J.
Scalable Multi-resolution Spatial Visualization for Anthropogenic Litter Data
人为垃圾数据的可扩展多分辨率空间可视化
Microblogs data management: a survey
  • DOI:
    10.1007/s00778-019-00569-6
  • 发表时间:
    2019-09
  • 期刊:
  • 影响因子:
    0
  • 作者:
    A. Magdy;Laila Abdelhafeez;Yunfan Kang;Eric Ong;M. Mokbel
  • 通讯作者:
    A. Magdy;Laila Abdelhafeez;Yunfan Kang;Eric Ong;M. Mokbel
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Amr Magdy其他文献

Guest Editorial: Special Issue on Analytics for Local Events and News
  • DOI:
    10.1007/s10707-020-00409-8
  • 发表时间:
    2020-04-23
  • 期刊:
  • 影响因子:
    2.600
  • 作者:
    Amr Magdy;Xun Zhou;Daniel B. Neill
  • 通讯作者:
    Daniel B. Neill
On scalable DCEL overlay operations
  • DOI:
    10.1007/s10707-025-00539-x
  • 发表时间:
    2025-04-23
  • 期刊:
  • 影响因子:
    2.600
  • 作者:
    Andres Calderon-Romero;Laila Abdelhafeez;Goce Trajcevski;Amr Magdy;Vassilis J. Tsotras
  • 通讯作者:
    Vassilis J. Tsotras

Amr Magdy的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Amr Magdy', 18)}}的其他基金

CAREER: Scalable Spatial Data Science on User-generated Data
职业:基于用户生成数据的可扩展空间数据科学
  • 批准号:
    2237348
  • 财政年份:
    2023
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Continuing Grant

相似国自然基金

全钒液流电池负极V(II)/V(III)电化学氧化还原的催化机理研究
  • 批准号:
    2025JJ50094
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
MXene/nZVI@FH材料微域层界面调控水中砷(III)氧化迁移机制
  • 批准号:
    2025JJ50319
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
硅基III-V族亚微米线激光器的光场模式调控与耦合机理研究
  • 批准号:
    JCZRQN202501004
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
吡咯烷生物碱所致肝窦阻塞综合征III区肝损伤的新机制——局部氨代谢紊乱
  • 批准号:
    JCZRYB202500652
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
HOXC8/OPN/CD44/EGFR轴介导的奥沙利铂耐药性在III期右半结肠癌耐药进展中的研究
  • 批准号:
    2025JJ50694
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
AI结合超声原始射频信号评估Bethesda III/IV类甲状腺肿瘤包膜和血管侵犯研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
硫化砷靶向VPS4B-ESCRT-III调控自噬溶酶体通路逆转三阴性乳腺癌顺铂耐药性的研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
ASPGR与MRC2双受体介导铱(III)配合物 脂质体抗肝肿瘤研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Ap-Exo III 联合模式识别构建降尿酸药 物筛选新方法的研究
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
经关节突截骨矫治III期Kummell病临床有效性分析
  • 批准号:
  • 批准年份:
    2025
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2415562
  • 财政年份:
    2023
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
III: Medium: CARE: Interactive Systems for Scalable, Causal Data Science
III:媒介:CARE:可扩展因果数据科学的交互式系统
  • 批准号:
    2312561
  • 财政年份:
    2023
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Continuing Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2341725
  • 财政年份:
    2023
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2212508
  • 财政年份:
    2022
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
III: SMALL: Scalable In-Database Prescriptive Analytics for Dynamic Environments
III:小型:适用于动态环境的可扩展数据库内规范分析
  • 批准号:
    2211918
  • 财政年份:
    2022
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
SemiSynBio-III: Scalable Nucleic Acid Memory
SemiSynBio-III:可扩展核酸内存
  • 批准号:
    2227626
  • 财政年份:
    2022
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2212512
  • 财政年份:
    2022
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Medium: Algorithms for scalable inference and phylodynamic analysis of tumor haplotypes using low-coverage single cell sequencing data
合作研究:III:中:使用低覆盖率单细胞测序数据对肿瘤单倍型进行可扩展推理和系统动力学分析的算法
  • 批准号:
    2212511
  • 财政年份:
    2022
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
III: Medium: Scalable Evolutionary Analysis of SNVs and CNAs in Cancer Using Single-Cell DNA Sequencing Data
III:中:使用单细胞 DNA 测序数据对癌症中的 SNV 和 CNA 进行可扩展的进化分析
  • 批准号:
    2106837
  • 财政年份:
    2021
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Continuing Grant
III: Medium: Collaborative Research: Towards Scalable and Interpretable Graph Neural Networks
III:媒介:协作研究:迈向可扩展和可解释的图神经网络
  • 批准号:
    1955285
  • 财政年份:
    2020
  • 资助金额:
    $ 17.49万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了