基于图模型的海量非结构化数据查询语言及其优化实现
结题报告
批准号:
61170086
项目类别:
面上项目
资助金额:
57.0 万元
负责人:
钱卫宁
依托单位:
学科分类:
F0202.系统软件、数据库与工业软件
结题年份:
2015
批准年份:
2011
项目状态:
已结题
项目参与者:
张召、赵斌、王义、张灿、祝海通、李春生、马海欣
国基评审专家1V1指导 中标率高出同行96.8%
结合最新热点,提供专业选题建议
深度指导申报书撰写,确保创新可行
指导项目中标800+,快速提高中标率
客服二维码
微信扫码咨询
中文摘要
海量非结构化数据的管理是新型数据密集型应用中碰到的重要问题,图模型是对非结构数据进行建模的一种重要工具。本项目旨在针对Web数据管理、科学数据管理等应用对于海量非结构化数据管理的需求,系统研究基于图模型的非结构化数据查询语言的形式化定义和语义基础、灵活/可扩展的查询语言设计、针对集群环境的查询计划表示与代价模型,以及高效的适应性分布式查询优化算法。项目将针对应用中查询需求多样、数据量大、应用环境为大规模集群的特点,重点研究基于图模型的查询语言的形式化描述、环境相关的查询计划表示和代价模型,集群环境中无集中控制的分布式代价估计、代价维护和适应性查询处理和优化技术,并通过具有实际应用背景的原型系统验证所研究方法的有效性。项目的研究工作基于项目组成员多年来对于分布式和P2P系统中的查询处理、Web数据管理、集群环境中的数据存储与索引研究工作,是现有研究的自然延续。项目目标明确,可行性较强。
英文摘要
海量非结构化数据的管理是新型数据密集型应用中碰到的重要问题,图模型是对非结构数据进行建模的一种重要工具。本项目针对 Web 数据管理、科学数据管理等应用对于海量非结构化数据管理的需求,系统研究基于图模型的非结构化数据查询语言的形式化定义和语义基础、灵活/可扩展的查询语言设计、针对集群环境的查询计划表示与代价模型,以及高效的适应性分布式查询优化算法。项目针对应用中查询需求多样、数据量大、应用环境为大规模集群的特点,重点研究基于图模型的查询语言的形式化描述、环境相关的查询计划表示和执行,集群环境中的分布式查询处理和优化技术,并通过具有实际应用背景的原型系统验证所研究方法的有效性。..经过四年的研发,项目课题按照原计划进行。项目以社交媒体这一典型的大规模图数据为切入点,形式化地定义了图数据模型下社交流(social stream)查询语言SSQL;结合社交网络应用的图数据查询需求,制定了社交网络分析型查询基准评测,以公开、可测量的形式,描述了图模型数据查询需求;在基准评测中,对图模式匹配、时序查询、热点查询等典型查询模式进行了定义,同时定义了这些典型查询模式的查询计划表示方法;在制定基准评测时,对影响图模型数据的统计特征,特别是其中显著影响查询性能的统计特征进行了定义和分析,同时研究了分布式环境下统计特征计算和估计方法;项目着重研究了社交数据流这一典型图模型数据的查询处理和优化技术,包括社交数据流统计值查询处理、图结构数据的压缩以及基于压缩图的查询处理技术、社交数据流的自适应取样等;项目组收集了海量社交媒体数据,基于这些数据,利用课题所研发的技术,课题组设计和开发了网上集群行为资源库,展示和验证了课题所研发的图模型数据查询处理和优化技术的有效性。..项目组成员在重要学术会议和重要学术期刊上发表18篇高质量的学术论文(包括15篇研究论文和3篇演示论文),申请发明专利6项,申请并获得软件著作权6项,获得教育部科技进步二等奖1项(第5获奖人),培养博士5人(2人毕业),硕士5人(毕业5人)。
期刊论文列表
专著列表
科研奖励列表
会议论文列表
专利列表
Analyzing user behavior of the micro-blogging website Sina Weibo during hot social events
热点社会事件期间微博网站新浪微博的用户行为分析
DOI:10.1016/j.physa.2013.09.059
发表时间:2014-02-01
期刊:PHYSICA A-STATISTICAL MECHANICS AND ITS APPLICATIONS
影响因子:3.3
作者:Guan, Wanqiu;Gao, Haoyu;Yang, Xiaoguang
通讯作者:Yang, Xiaoguang
Ranking related research papers based on citation graph
根据引用图对相关研究论文进行排名
DOI:--
发表时间:2014
期刊:Journal of Dong Hua University (english Edition)
影响因子:--
作者:Cai, A-Ni;Gong, Xue-Qing;Qian, Wei-Ning;Zhou, Ao-Ying
通讯作者:Zhou, Ao-Ying
Detecting anomaly in data streams by fractal model
通过分形模型检测数据流中的异常
DOI:10.1007/s11280-014-0296-y
发表时间:2014-06
期刊:Journal of World Wide Web (WWWJ)
影响因子:--
作者:Zhang Rong;Zhou Minqi;Gong Xueqing;He Xiaofeng;Qian Weining;Qin Shouke;Zhou Aoying
通讯作者:Zhou Aoying
DOI:--
发表时间:2014
期刊:华东师范大学学报(自然科学版)
影响因子:--
作者:孔超;钱卫宁;周傲英
通讯作者:周傲英
DOI:10.1016/j.datak.2013.05.003
发表时间:2013-09
期刊:Data Knowl. Eng.
影响因子:--
作者:Bin Zhao;Zhao Zhang;Weining Qian;Aoying Zhou
通讯作者:Bin Zhao;Zhao Zhang;Weining Qian;Aoying Zhou
面向教育的数据驱动学习行为建模与可解释性分析
  • 批准号:
    62137001
  • 项目类别:
    重点项目
  • 资助金额:
    299万元
  • 批准年份:
    2021
  • 负责人:
    钱卫宁
  • 依托单位:
行为数据驱动的个性化计算机科学教育方法与系统
  • 批准号:
    61977026
  • 项目类别:
    面上项目
  • 资助金额:
    52.0万元
  • 批准年份:
    2019
  • 负责人:
    钱卫宁
  • 依托单位:
支持可扩展事务处理的数据库日志机制及其实现
  • 批准号:
    61672232
  • 项目类别:
    面上项目
  • 资助金额:
    16.0万元
  • 批准年份:
    2016
  • 负责人:
    钱卫宁
  • 依托单位:
大数据管理系统评测基准的理论与方法
  • 批准号:
    61432006
  • 项目类别:
    重点项目
  • 资助金额:
    350.0万元
  • 批准年份:
    2014
  • 负责人:
    钱卫宁
  • 依托单位:
支持海量非结构数据可视化分析的存储与索引
  • 批准号:
    61070051
  • 项目类别:
    面上项目
  • 资助金额:
    11.0万元
  • 批准年份:
    2010
  • 负责人:
    钱卫宁
  • 依托单位:
国内基金
海外基金