BIGDATA: Small: DA: Statistical Machine Learning Methods for Scalable Data Analysis

BIGDATA:小型:DA:用于可扩展数据分析的统计机器学习方法

基本信息

  • 批准号:
    1250985
  • 负责人:
  • 金额:
    $ 73.9万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2013
  • 资助国家:
    美国
  • 起止时间:
    2013-07-01 至 2017-06-30
  • 项目状态:
    已结题

项目摘要

Big Data has become ubiquitous in modern industrial and scientific applications where the size and dimensionality of data are becoming so large as to require new statistical tools for efficient data analysis. This collaborative project involving researchers at Rutgers University and Microsoft Research focuses on the theoretical and algorithmic development of advanced computational methods for big data analytics. While the problems to be investigated are motivated by various Internet applications, the resulting solutions are expected to be broadly applicable to other domains. The project considers three interrelated main themes in big data analytics: (a) effective sampling of big datasets to filter out unreliable data source and improve statistical analysis; (b) dimensionality reduction techniques that can best preserve information via hashing and sparse random projection techniques; and (c) large scale optimization techniques for machine learning that can directly handle large datasize. Anticipated results of this work include new theoretical results, new data analytics algorithms, and their open source software implementations.Broader impacts of the research include broadly disseminated open source implementations of scalable data analytics algorithms, research-based training and education of graduate and undergraduate students, and academic-industrial collaborations resulting in an interplay between fundamental research in machine learning and industrial applications.
大数据在现代工业和科学应用中无处不在,数据的大小和维度变得如此之大,以至于需要新的统计工具来进行有效的数据分析。这个合作项目涉及罗格斯大学和微软研究院的研究人员,重点是大数据分析高级计算方法的理论和算法开发。虽然要调查的问题是由各种互联网应用的动机,由此产生的解决方案,预计将广泛适用于其他领域。该项目考虑了大数据分析中三个相互关联的主题:(a)对大数据集进行有效采样,以过滤掉不可靠的数据源并改进统计分析;(B)降维技术,可以通过哈希和稀疏随机投影技术最好地保留信息;(c)用于机器学习的大规模优化技术,可以直接处理大数据量。这项工作的预期成果包括新的理论成果、新的数据分析算法及其开源软件实现。这项研究的更广泛影响包括广泛传播的可扩展数据分析算法的开源实现、基于研究的培训和对研究生和本科生的教育、以及学术与工业的合作,导致机器学习基础研究与工业应用之间的相互作用。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Cun-Hui Zhang其他文献

EMPIRICAL BAYES AND COMPOUND ESTIMATION OF NORMAL MEANS
  • DOI:
  • 发表时间:
    1997
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cun-Hui Zhang
  • 通讯作者:
    Cun-Hui Zhang
Risk bounds in isotonic regression
  • DOI:
    10.1214/aos/1021379864
  • 发表时间:
    2002-04
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Cun-Hui Zhang
  • 通讯作者:
    Cun-Hui Zhang
Fourier Methods for Estimating Mixing Densities and Distributions
  • DOI:
    10.1214/aos/1176347627
  • 发表时间:
    1990-06
  • 期刊:
  • 影响因子:
    4.5
  • 作者:
    Cun-Hui Zhang
  • 通讯作者:
    Cun-Hui Zhang
Some Moment and Exponential Inequalities for V-Statistics with Bounded Kernels
GENERALIZED MAXIMUM LIKELIHOOD ESTIMATION OF NORMAL MIXTURE DENSITIES
  • DOI:
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Cun-Hui Zhang
  • 通讯作者:
    Cun-Hui Zhang

Cun-Hui Zhang的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Cun-Hui Zhang', 18)}}的其他基金

Estimation and Inference with High-Dimensional Data
高维数据的估计和推理
  • 批准号:
    2210850
  • 财政年份:
    2022
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
FRG: Collaborative Research: Dynamic Tensors: Statistical Methods, Theory, and Applications
FRG:协作研究:动态张量:统计方法、理论和应用
  • 批准号:
    2052949
  • 财政年份:
    2021
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
Collaborative Research: Statistical Methods, Algorithms, and Theory for Large Tensors
合作研究:大张量的统计方法、算法和理论
  • 批准号:
    1721495
  • 财政年份:
    2017
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Continuing Grant
SEMIPARAMETRIC INFERENCE WITH HIGH-DIMENSIONAL DATA
高维数据的半参数推理
  • 批准号:
    1513378
  • 财政年份:
    2015
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Continuing Grant
RI: Medium: Collaborative Research: Next-Generation Statistical Optimization Methods for Big Data Computing
RI:媒介:协作研究:大数据计算的下一代统计优化方法
  • 批准号:
    1407939
  • 财政年份:
    2014
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Continuing Grant
STATISTICAL INFERENCE WITH HIGH-DIMENSIONAL DATA
高维数据的统计推断
  • 批准号:
    1209014
  • 财政年份:
    2012
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
Statistical Problems in Closed-Loop Diabetes Control
闭环糖尿病控制中的统计问题
  • 批准号:
    1106753
  • 财政年份:
    2011
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
Statistical Methods and Theory in Some High-Dimensional Problems
一些高维问题的统计方法和理论
  • 批准号:
    0906420
  • 财政年份:
    2009
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
Multi-Way Semilinear Methods with Applications to Microarray Data
多路半线性方法在微阵列数据中的应用
  • 批准号:
    0604571
  • 财政年份:
    2006
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
Complex Datasets and Inverse Problems: Tomography, Networks, and Beyond; Rutgers University - New Brunswick, NJ; October 21-22, 2005
复杂数据集和反问题:断层扫描、网络等;
  • 批准号:
    0534181
  • 财政年份:
    2005
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

BIGDATA: Small: DA: Collaborative Research: Real Time Observation Analysis for Healthcare Applications via Automatic Adaptation to Hardware Limitations
BIGDATA:小型:DA:协作研究:通过自动适应硬件限制对医疗保健应用进行实时观察分析
  • 批准号:
    1638429
  • 财政年份:
    2016
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Mining large graphs through subgraph sampling
BIGDATA:小:DA:通过子图采样挖掘大图
  • 批准号:
    1250786
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Collaborative Research: Real Time Observation Analysis for Healthcare Applications via Automatic Adaptation to Hardware Limitations
BIGDATA:小型:DA:协作研究:通过自动适应硬件限制对医疗保健应用进行实时观察分析
  • 批准号:
    1251031
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Classification Platform for Novel Scientific Insight on Time-Series Data
BIGDATA:小型:DA:时间序列数据新科学见解的分类平台
  • 批准号:
    1251274
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: DCM: Measurement and Learning in Large-Scale Social Networks
BIGDATA:小型:DA:DCM:大规模社交网络中的测量和学习
  • 批准号:
    1251267
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
BIGDATA: Small DA Social Behavior Driven Modeling and Optimization of Information
BIGDATA:小型 DA 社会行为驱动的信息建模和优化
  • 批准号:
    8842138
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
BIGDATA: Small: DA: A Random Projection Approach
大数据:小:DA:随机投影方法
  • 批准号:
    1419210
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Dynamical diffusion map methods for high dimensional data
BIGDATA:小:DA:高维数据的动态扩散图方法
  • 批准号:
    1250936
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Continuing Grant
BIGDATA: Small: DCM: DA: Building a Mergeable and Interactive Distributed Data Layer for Big Data Summarization Systems
BIGDATA:小型:DCM:DA:为大数据汇总系统构建可合并和交互式的分布式数据层
  • 批准号:
    1251019
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
BIGDATA: Small: DA: Big Multilinguality for Data-Driven Lexical Semantics
BIGDATA:小:DA:数据驱动词汇语义的大多语言性
  • 批准号:
    1251131
  • 财政年份:
    2013
  • 资助金额:
    $ 73.9万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了