III: Small: Collaborative Research: Cost-Efficient Sampling and Estimation from Large-Scale Networks

III:小型:协作研究:大规模网络的经济高效采样和估计

基本信息

  • 批准号:
    1908375
  • 负责人:
  • 金额:
    $ 25万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2022-01-31
  • 项目状态:
    已结题

项目摘要

Sampling and estimating structural information from large-scale networks or graphs has been central to our understanding of the network dynamics and its rich set of applications. Markov Chain Monte Carlo (MCMC) has been the key enabler for a broader context of graph sampling, including estimating the properties of large graphs, sampling the corpus of documents indexed by search engines, sampling records from hidden databases behind Web forms, identifying subgraphs of certain characteristics and frequent graph pattern matching. Despite versatile applications of the MCMC methods and their customized algorithms for analyzing graph-structured data in various forms, there still exist critical challenges and limitations in the literature centered around the MCMC methods. One is the 'cost' consumption/constraints associated with the sampling operation, which limits the size of total samples obtained and negatively affects the accuracy of any estimator based on the obtained samples. Another limitation is that the recent advances in MCMC, especially built up on favorable non-reversible Markov chains, cannot be leveraged to the various large-graph sampling tasks, due to their required global knowledge of the underlying state space, lack of distribution implementation, unconstrained state space, as well as the simplified cost assumption. The goal of this research is to fully exploit the potentials of a set of crawling samplers by making the samplers adaptive and possibly interactive on a properly constructed graph domain, to transcend the current status-quo in the wide range of graph sampling tasks. Specifically, the project aims to: (i) build a theoretical framework to construct a suite of cost-efficient sampling policies by optimally balancing the tradeoff between the sample quality and quantity under challenged access environments with a given cost budget, (ii) design a class of adaptive random walks by fully exploiting the past information to achieve minimal temporal correlations over the obtained samples and by controlling the random walks collectively to enable maximal space exploration, and (iii) extend the standard MCMC toolkits toward faster and more cost-efficient exploration of feasible subgraphs/configurations and computing/optimization on a graph, along with extensive validations to create practical and usable solutions in reality. This research has a high potential impact on a vast range of multi-disciplinary applications, including sampling large-scale graphs for statistical inference and efficient estimation and randomized algorithms for combinatorial optimizations in various disciplines, where the standard MCMC methods have been dominant but also constrained our understanding.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
来自大规模网络或图形的采样和估算结构信息对于我们对网络动态及其丰富应用集集的理解至关重要。马尔可夫链蒙特卡洛(MCMC)一直是更广泛的图形采样背景的关键推动者,包括估计大图的属性,对搜索引擎索引的文档语料库进行采样,从隐藏的数据库背后的隐藏数据库中采样记录,识别某些特征的子分类,并识别某些特征和频繁的图形模式匹配。尽管MCMC方法的多功能应用及其定制算法用于分析各种形式的图形结构数据,但仍存在围绕MCMC方法的文献中的关键挑战和局限性。一个是与采样操作相关的“成本”消耗/约束,该操作限制了获得的总样品的大小,并基于获得的样品对任何估计器的准确性产生负面影响。另一个局限性是,MCMC的最新进展,尤其是建立在有利的非可逆马尔可夫链上的基础上,由于其所需的全球对基本状态空间的了解,缺乏分配的实施,不受约束的状态空间以及简化的成本假设,因此无法将各种大型抽样任务利用。这项研究的目的是通过使采样器自适应和可能在正确构造的图形域上进行自适应和可能交互式来充分利用一组爬行采样器的电势,以在广泛的图形采样任务中超越当前状态。具体而言,该项目的目的是:(i)建立一个理论框架,通过在挑战的访问环境中最佳平衡样品质量和数量之间的折衷与给定的成本预算,(ii)设计一类自适应随机步行,通过实现最小的信息,并实现最小的随机步行,并通过实现最小的时间,并通过实现较小的时间来控制,并通过实现较小的时间来控制样本质量和数量,从而构建了一系列具有成本效益的抽样策略,并实现了最小的随机步行。探索和(iii)将标准的MCMC工具包扩展到对可行的子图/配置以及图表上可行的子图/配置和计算/优化的更快,更具成本效益的探索,以及在现实中创建实用和可用的解决方案的广泛验证。这项研究对广泛的多学科应用具有很大的潜在影响,包括对统计推理和有效估计和有效估计和随机算法进行大规模图表,以在各种学科中进行组合优化,其中标准的MCMC方法在其中占主导地位,但也限制了我们的理解。更广泛的影响审查标准。

项目成果

期刊论文数量(3)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
An Efficient and Scalable Algorithm for Estimating Kemeny's Constant of a Markov Chain on Large Graphs
Estimating Distributions of Large Graphs from Incomplete Sampled Data
Trapping Malicious Crawlers in Social Networks
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Chul-Ho Lee其他文献

Melted insulator state under pressure in layered structured (Eu3-nSrn)Bi2S4F4
层状结构 (Eu3-nSrn)Bi2S4F4 中绝缘体在压力下的熔化状态
  • DOI:
  • 发表时间:
    2016
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Bosen Wang;Kazuyuki Matsubayashi;Jinguang Cheng;Chul-Ho Lee;Yoshiya Uwatoko
  • 通讯作者:
    Yoshiya Uwatoko
Fe(III)複合酸化物のメタノール分解光触媒活性
Fe(III)复合氧化物的甲醇分解光催化活性
  • DOI:
  • 发表时间:
    2012
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Hirotaka Nishiate;Michihiro Ohta;Atsushi Yamamoto;Haruhiko Obara;Chul-Ho Lee;Kazuo Ueno;手塚慶太郎,菊池優斗,単躍進,井本英夫
  • 通讯作者:
    手塚慶太郎,菊池優斗,単躍進,井本英夫
Thermoelectric properties of a new Zintl phase NaZn4As3 with ultralow thermal conductivity
超低导热系数Zintl相NaZn4As3的热电性能
  • DOI:
  • 发表时间:
    2018
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Aichi Yamashita;Kunihiro Kihou;Haruno Kunioka;Hirotaka Nishiate;Atsushi Yamamoto;Yoshihiko Takano;Chul-Ho Lee
  • 通讯作者:
    Chul-Ho Lee
"East" and "West" as Seen in the Structure of Serbian: Langauge Contact and its Consequences
塞尔维亚语结构中的“东方”与“西方”:语言接触及其后果
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Kazumasa Horigane;Chul-Ho Lee;Kunihiro Kihou;Kay Fujita;Ryoichi Kajimoto;Sungdae Ji;Jun Akimitsu;石川芳郎,,小中栄一,坂井田美代子,松本正志,近藤幸一,原田宗一,大杉豊 編;Motoki Nomachi
  • 通讯作者:
    Motoki Nomachi
Characteristic charge transport in oxygen-deficiency-controlled <math xmlns:mml="http://www.w3.org/1998/Math/MathML" altimg="si12.gif" overflow="scroll" class="math"><mrow><mi mathvariant="italic">Ln</mi><msub><mrow><mtext>FeAsO</mtext></mrow><mrow><mn>1</mn><mo>-</mo><mi>y</mi></mrow></msub></mrow></math> (<em>Ln</em> = La and Nd)
  • DOI:
    10.1016/j.physc.2010.01.026
  • 发表时间:
    2010-12-01
  • 期刊:
  • 影响因子:
  • 作者:
    Shigeyuki Ishida;Masamichi Nakajima;Yasuhide Tomioka;Toshimitsu Ito;Kiichi Miyazawa;Hijiri Kito;Chul-Ho Lee;Motoyuki Ishikado;Shin-ichi Shamoto;Akira Iyo;Hiroshi Eisaki;Kenji M. Kojima;Shin-ichi Uchida
  • 通讯作者:
    Shin-ichi Uchida

Chul-Ho Lee的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Chul-Ho Lee', 18)}}的其他基金

Collaborative Research: CNS Core: Small: Closing the Theory-Practice Gap in Understanding and Combating Epidemic Spreading on Resource-Constrained Large-Scale Networks
合作研究:CNS核心:小型:缩小理解和抗击资源有限的大规模网络上的流行病传播的理论与实践差距
  • 批准号:
    2209922
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
III: Small: Collaborative Research: Cost-Efficient Sampling and Estimation from Large-Scale Networks
III:小型:协作研究:大规模网络的经济高效采样和估计
  • 批准号:
    2209921
  • 财政年份:
    2021
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: CNS Core: Small: Closing the Theory-Practice Gap in Understanding and Combating Epidemic Spreading on Resource-Constrained Large-Scale Networks
合作研究:CNS核心:小型:缩小理解和抗击资源有限的大规模网络上的流行病传播的理论与实践差距
  • 批准号:
    2007828
  • 财政年份:
    2020
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant

相似国自然基金

基于超宽频技术的小微型无人系统集群协作关键技术研究与应用
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    57 万元
  • 项目类别:
    面上项目
异构云小蜂窝网络中基于协作预编码的干扰协调技术研究
  • 批准号:
    61661005
  • 批准年份:
    2016
  • 资助金额:
    30.0 万元
  • 项目类别:
    地区科学基金项目
密集小基站系统中的新型接入理论与技术研究
  • 批准号:
    61301143
  • 批准年份:
    2013
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
ScFVCD3-9R负载Bcl-6靶向小干扰RNA治疗EAMG的试验研究
  • 批准号:
    81072465
  • 批准年份:
    2010
  • 资助金额:
    31.0 万元
  • 项目类别:
    面上项目
基于小世界网络的传感器网络研究
  • 批准号:
    60472059
  • 批准年份:
    2004
  • 资助金额:
    21.0 万元
  • 项目类别:
    面上项目

相似海外基金

Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322973
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
  • 批准号:
    2322974
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336769
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
  • 批准号:
    2336768
  • 财政年份:
    2024
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
  • 批准号:
    2311990
  • 财政年份:
    2023
  • 资助金额:
    $ 25万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了