BIGDATA: Small: DA: Mining large graphs through subgraph sampling

BIGDATA:小:DA:通过子图采样挖掘大图

基本信息

  • 批准号:
    1250786
  • 负责人:
  • 金额:
    $ 54.84万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-10-01 至 2018-09-30
  • 项目状态:
    已结题

项目摘要

The size and complexity of these "Big Data" graphs have always posed significant challenges, limiting the scope of their analysis and thus also limiting the implications that one can draw from them. Mining data from large real-world graphs typically poses two challenges: one of computational resources and another of incomplete information. A comprehensive analysis of these graphs has usually required access to large distributed computing platforms and sophisticated software. This project aims to address a portion of these challenges by investigating a new method, based in statistics and spectral graph theory, to infer essential properties of the full graph through extracting a representative sample of small subgraphs from the full graph. The goal is to reduce the computational burden on researchers interested in large graphs and thus broaden participation in "Big Data" activities. As is now well-understood, the analysis of large graphs has many applications in a variety of fields including business, economics, public policy development, law enforcement, public health, sociology and, of course, computer science. This breadth of applicability and the proposed curriculum development activities have the potential to draw and retain a greater diversity of students into computer science and engineering and increasing the participation by under-represented groups.Many of the principal properties of a graph can be inferred from the graph spectrum (eigenvalues of its adjacency or the normalized Laplacian matrix). In particular, a rich set of interlacing results in spectral graph theory allows one to bound the eigenvalues of the full graph using the eigenvalues of its subgraphs. This project will develop new algorithms for generating subgraph samples, and then use basic estimation theory from statistics and the interlacing results from spectral graph theory to discern properties of a large graph. The new method based on subgraph sampling (as opposed to node or edge sampling) uses results from spectral graph theory and statistics to estimate the spectrum (eigenvalues) of the graph based on the spectrum of the sampled subgraphs. The goal is to allow a meaningful analysis of extremely large graphs without the use of anything beyond a typical desktop computer. The data collected and the algorithms developed as part of this project will be made available to the larger research community through a data repository hosted by Drexel University. The project will also make contributions to open-source software.
这些“大数据”图表的规模和复杂性一直构成重大挑战,限制了其分析范围,从而也限制了人们可以从中得出的影响。从大型真实世界图中挖掘数据通常会带来两个挑战:一个是计算资源,另一个是不完整的信息。 对这些图的全面分析通常需要访问大型分布式计算平台和复杂的软件。该项目旨在通过研究一种基于统计和谱图理论的新方法来解决这些挑战的一部分,通过从全图中提取具有代表性的小子图样本来推断全图的基本属性。其目标是减少对大型图感兴趣的研究人员的计算负担,从而扩大对“大数据”活动的参与。 正如现在所理解的,大型图的分析在各种领域中有许多应用,包括商业,经济学,公共政策制定,执法,公共卫生,社会学,当然还有计算机科学。这种广泛的适用性和拟议的课程开发活动有可能吸引和保留更多的学生进入计算机科学和工程,并增加代表性不足的群体的参与。特别是,谱图理论中丰富的交织结果集允许人们使用其子图的特征值来绑定完整图的特征值。本计画将发展新的演算法来产生子图样本,然后利用统计学的基本估计理论和频谱图理论的交错结果来辨识大型图的性质。 基于子图采样(与节点或边采样相反)的新方法使用谱图理论和统计学的结果,根据采样子图的谱来估计图的谱(特征值)。其目标是允许对非常大的图形进行有意义的分析,而无需使用典型的台式计算机之外的任何东西。作为该项目的一部分,收集的数据和开发的算法将通过德雷克塞尔大学托管的数据存储库提供给更大的研究社区。该项目还将为开源软件做出贡献。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Harish Sethu其他文献

Degree-sequenced matching algorithms for input-queued switches
  • DOI:
    10.1007/s11235-006-9024-y
  • 发表时间:
    2006-12-20
  • 期刊:
  • 影响因子:
    2.300
  • 作者:
    Madhusudan Hosaagrahara;Harish Sethu
  • 通讯作者:
    Harish Sethu

Harish Sethu的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Harish Sethu', 18)}}的其他基金

NeTS:Small:Collaborative Research: An Integrated Environment-Independent Approach to Topology Control in Wireless Ad Hoc Networks
NetS:Small:协作研究:无线自组织网络中与环境无关的拓扑控制集成方法
  • 批准号:
    0915393
  • 财政年份:
    2009
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
CAREER: Novel Wormhole Switch Architectures for High Performance with Fairness
职业:新颖的虫洞交换机架构,实现高性能和公平性
  • 批准号:
    9984161
  • 财政年份:
    2000
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

BIGDATA: Small: DA: Collaborative Research: Real Time Observation Analysis for Healthcare Applications via Automatic Adaptation to Hardware Limitations
BIGDATA:小型:DA:协作研究:通过自动适应硬件限制对医疗保健应用进行实时观察分析
  • 批准号:
    1638429
  • 财政年份:
    2016
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Collaborative Research: Real Time Observation Analysis for Healthcare Applications via Automatic Adaptation to Hardware Limitations
BIGDATA:小型:DA:协作研究:通过自动适应硬件限制对医疗保健应用进行实时观察分析
  • 批准号:
    1251031
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Classification Platform for Novel Scientific Insight on Time-Series Data
BIGDATA:小型:DA:时间序列数据新科学见解的分类平台
  • 批准号:
    1251274
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: DCM: Measurement and Learning in Large-Scale Social Networks
BIGDATA:小型:DA:DCM:大规模社交网络中的测量和学习
  • 批准号:
    1251267
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
BIGDATA: Small DA Social Behavior Driven Modeling and Optimization of Information
BIGDATA:小型 DA 社会行为驱动的信息建模和优化
  • 批准号:
    8842138
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
BIGDATA: Small: DA: A Random Projection Approach
大数据:小:DA:随机投影方法
  • 批准号:
    1419210
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Dynamical diffusion map methods for high dimensional data
BIGDATA:小:DA:高维数据的动态扩散图方法
  • 批准号:
    1250936
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Continuing Grant
BIGDATA: Small: DCM: DA: Building a Mergeable and Interactive Distributed Data Layer for Big Data Summarization Systems
BIGDATA:小型:DCM:DA:为大数据汇总系统构建可合并和交互式的分布式数据层
  • 批准号:
    1251019
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
  • 批准号:
    1251131
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Patient-level predictive modeling from massive longitudinal databases
大数据:小:DA:来自海量纵向数据库的患者级预测模型
  • 批准号:
    1251151
  • 财政年份:
    2013
  • 资助金额:
    $ 54.84万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了