CDI-Type II: Collaborative Research: Sparse Inference: New Tools for Structural Knowledge Discovery

CDI-Type II:协作研究:稀疏推理:结构知识发现的新工具

基本信息

  • 批准号:
    0835550
  • 负责人:
  • 金额:
    $ 41.72万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2008
  • 资助国家:
    美国
  • 起止时间:
    2008-09-15 至 2013-02-28
  • 项目状态:
    已结题

项目摘要

In most areas of human knowledge, the information revolution has resulted in a massive data explosion. The scale of data sets, their distributed and heterogeneous nature, and the need to quickly deliver results easily interpretable by non-experts, raise new theoretical and computational challenges for statistical learning, from variable selection and structural inference to visualization and online learning. This project uses sparse statistical inference as a powerful approach to meet these challenges. Its key insight is that seeking sparsity is a meaningful way of simultaneously stabilizing inference procedures, and highlighting structure in the underlying data. This work thus combines fundamental advances in sparse statistical learning with cutting-edge computational tools from mathematical programming to create a new framework for structural knowledge discovery in large-scale, streaming data sets. It is focused on two fundamental themes in sparse inference: variable selection and structural inference. Variable selection seeks to isolate a few key variables from high dimensional data sets and is a fundamental preprocessing tool in statistical learning. Structural inference then aims to consistently identify a few core dependence relationships among these variables to highlight its structure. From a computational point of view, many recent results in machine learning have relied on advanced methods from convex optimization such as semidefinite programming and robust optimization and this project seeks to improve the complexity of these algorithms and their capacity to handle very-large scale, streaming data. In practice, this project is motivated by the desire to help the public understand our democracies by analyzing large-scale political and social data sets, with a particular focus on voting records, online news sources, and polling data. Its approach is to apply statistical inference principles to social sciences, using collaborations with experts in political science and economics to forge the models and techniques under study. In carrying out the research, this project will be training graduate students from statistics, electrical engineering/financial engineering into interdisciplinary researchers at the interface of statistics, optimization, and subject matter areas such as finance and political science. In addition we plan to develop a web site, accessible first to a restricted set of social science researchers, to allow them to analyze mid-sized corpora of online news in text format, in the form of say, sparse graphs of words showing statistical associations between given keywords. The PIs plan to develop a software toolbox implementing these results, interfaced with common numerical packages such as MATLAB, R or python as well as an undergraduate course on ``Statistical Analysis of Online Data" at Berkeley and Princeton, incorporating some of the material produced in this project into the course program.
在人类知识的大多数领域,信息革命导致了大规模的数据爆炸。数据集的规模及其分布式和异构性,以及需要迅速提供非专家容易解释的结果,对统计学习提出了新的理论和计算挑战,从变量选择和结构推理到可视化和在线学习。该项目使用稀疏统计推断作为应对这些挑战的有力方法。它的关键见解是,寻求稀疏性是一种有意义的方式,可以同时稳定推理过程,并突出底层数据的结构。因此,这项工作将稀疏统计学习的基本进展与数学编程中的尖端计算工具相结合,创建了一个在大规模流数据集中发现结构化知识的新框架。它集中在稀疏推理中的两个基本主题:变量选择和结构推理。变量选择寻求从高维数据集中分离出几个关键变量,是统计学习中的基本预处理工具。然后,结构推理的目标是一致地识别这些变量之间的几个核心依赖关系,以突出其结构。从计算的角度来看,机器学习中的许多最新结果都依赖于凸优化的先进方法,如半定规划和稳健优化,该项目旨在提高这些算法的复杂性和处理超大规模流数据的能力。在实践中,这个项目的动机是希望通过分析大规模的政治和社会数据集,特别是投票记录、在线新闻来源和民意调查数据,帮助公众了解我们的民主制度。它的方法是将统计推理原理应用于社会科学,通过与政治学和经济学专家的合作来打造正在研究的模型和技术。在开展这项研究时,该项目将把统计学、电气工程/金融工程的研究生培养成统计学、最优化以及金融和政治学等学科领域的跨学科研究人员。此外,我们计划开发一个网站,首先对有限的社会科学研究人员开放,使他们能够以文本格式分析中等规模的在线新闻语料库,例如,以稀疏单词图的形式显示给定关键字之间的统计关联。投资促进机构计划开发一个实现这些结果的软件工具箱,与常见的数值工具包,如MATLAB、R或PYTHON以及在伯克利和普林斯顿大学开设的“在线数据的统计分析”的本科课程相结合,将该项目产生的一些材料纳入课程计划。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Laurent El Ghaoui其他文献

Multi-Objective Robust Measurement-scheduling for Discrete-Time Systems: An LMI Approach
  • DOI:
    10.1016/s1474-6670(17)41201-8
  • 发表时间:
    1997-10-01
  • 期刊:
  • 影响因子:
  • 作者:
    Stéphane Dussy;Laurent El Ghaoui
  • 通讯作者:
    Laurent El Ghaoui
Output <em>L</em><sup>2</sup> Control of Jump Systems: An LMI Approach
  • DOI:
    10.1016/s1474-6670(17)41199-2
  • 发表时间:
    1997-10-01
  • 期刊:
  • 影响因子:
  • 作者:
    Silviu-iulian Niculescu;Mustapha Aït-Rami;Laurent El Ghaoui
  • 通讯作者:
    Laurent El Ghaoui
Strategic EV Charging Optimization Using Stackelberg and Non-Cooperative Game Models for Cost Efficiency and Profit Maximization with Renewable Energy and Battery Storage
  • DOI:
    10.1007/s40866-025-00255-3
  • 发表时间:
    2025-03-17
  • 期刊:
  • 影响因子:
    1.900
  • 作者:
    Phi Long Nguyen;Cuong Le-The;Hung Ta Xuan;Khanh Dao Quoc;Danh Cuong Do;Laurent El Ghaoui;Tuyen Nguyen Duc
  • 通讯作者:
    Tuyen Nguyen Duc
Learnable features for predicting properties of metal-organic frameworks with deep neural networks
  • DOI:
    10.1016/j.xcrp.2024.102101
  • 发表时间:
    2024-08-21
  • 期刊:
  • 影响因子:
  • 作者:
    Van-Quyen Nguyen;Phuoc-Anh Le;Phi Long Nguyen;Tien-Lam Pham;Thi Viet Bac Phung;Kostya S. Novoselov;Laurent El Ghaoui
  • 通讯作者:
    Laurent El Ghaoui
Watching, creating, and archiving
观看、创建和存档
  • DOI:
    10.1177/1354856514560313
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Abigail De Kosnik;Laurent El Ghaoui;Vera Cuntz;A. Godbehere;Andrea Horbinski;Adam Hutz;Renée Pastel;Vu Pham
  • 通讯作者:
    Vu Pham

Laurent El Ghaoui的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Laurent El Ghaoui', 18)}}的其他基金

Collaborative Research: Mathematical Programming for Streaming Data
协作研究:流数据的数学编程
  • 批准号:
    1250687
  • 财政年份:
    2011
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: Mathematical Programming for Streaming Data
协作研究:流数据的数学编程
  • 批准号:
    0969923
  • 财政年份:
    2010
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: Mathematical Programming for Streaming Data
协作研究:流数据的数学编程
  • 批准号:
    0968842
  • 财政年份:
    2010
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: MSPA-MCS: Sparse Multivariate Data Analysis
合作研究:MSPA-MCS:稀疏多元数据分析
  • 批准号:
    0625371
  • 财政年份:
    2006
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
CAREER: Robust Optimization and Applications
职业:稳健优化和应用
  • 批准号:
    9983874
  • 财政年份:
    2000
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant

相似国自然基金

铋基邻近双金属位点Type B异质结光热催化合成氨机制研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    30.0 万元
  • 项目类别:
    省市级项目
智能型Type-I光敏分子构效设计及其抗耐药性感染研究
  • 批准号:
    22207024
  • 批准年份:
    2022
  • 资助金额:
    20 万元
  • 项目类别:
    青年科学基金项目
TypeⅠR-M系统在碳青霉烯耐药肺炎克雷伯菌流行中的作用机制研究
  • 批准号:
  • 批准年份:
    2021
  • 资助金额:
    55 万元
  • 项目类别:
    面上项目
替加环素耐药基因 tet(A) type 1 变异体在碳青霉烯耐药肺炎克雷伯菌中的流行、进化和传播
  • 批准号:
    LY22H200001
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
面向手性α-氨基酰胺药物的新型不对称Ugi-type 反应开发
  • 批准号:
    LY22B020003
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
BMP9/BMP type I receptors 通过激活 PPARα保护心肌梗死的机制研究
  • 批准号:
    LQ22H020003
  • 批准年份:
    2021
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
C2H2-type锌指蛋白在香菇采后组织软化进程中的作用机制研究
  • 批准号:
    32102053
  • 批准年份:
    2021
  • 资助金额:
    30 万元
  • 项目类别:
    青年科学基金项目
血管阻断型Type-I光敏剂合成及其三阴性乳腺癌光诊疗
  • 批准号:
    62120106002
  • 批准年份:
    2021
  • 资助金额:
    255 万元
  • 项目类别:
    国际(地区)合作与交流项目
Chichibabin-type偶联反应在构建联氮杂芳烃中的应用
  • 批准号:
  • 批准年份:
    2020
  • 资助金额:
    63 万元
  • 项目类别:
    面上项目
茶尺蠖Type-II环氧性信息素合成酶关键基因的鉴定及功能研究
  • 批准号:
    LQ21C140001
  • 批准年份:
    2020
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目

相似海外基金

CDI-Type II: Computational Methods to Enable an Invertebrate Paleontology Knowledgebase
CDI-Type II:支持无脊椎动物古生物学知识库的计算方法
  • 批准号:
    1308762
  • 财政年份:
    2014
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: CDI Type II: Dynamics and Control of Cardiac Tissue
合作研究:CDI II 型:心脏组织的动力学和控制
  • 批准号:
    1341128
  • 财政年份:
    2012
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative CDI-Type II: Cyber Enabled Discovery System for Advanced Multidisciplinary Study of Humanitarian Logistics for Disaster Response
协作 CDI-II 型:用于灾难响应人道主义后勤高级多学科研究的网络支持发现系统
  • 批准号:
    1123924
  • 财政年份:
    2012
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative CDI-Type II: Cyber Enabled Discovery System for Advanced Multidisciplinary Study of Humanitarian Logistics for Disaster Response
协作 CDI-II 型:用于灾难响应人道主义后勤高级多学科研究的网络支持发现系统
  • 批准号:
    1124827
  • 财政年份:
    2012
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: CDI- Type II: Towards Analyzing Complex Petascale Datasets: The Milky Way Laboratory
合作研究:CDI-II 型:分析复杂千万亿次数据集:银河系实验室
  • 批准号:
    1124453
  • 财政年份:
    2011
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: CDI-Type II: BirdCast: Novel Machine Learning Methods for Understanding Continent-Scale Bird Migration
合作研究:CDI-Type II:BirdCast:用于理解大陆规模鸟类迁徙的新型机器学习方法
  • 批准号:
    1125228
  • 财政年份:
    2011
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: CDI- Type II: Towards Analyzing Complex Petascale Datasets: The Milky Way Laboratory
合作研究:CDI-II 型:分析复杂千万亿次数据集:银河系实验室
  • 批准号:
    1124403
  • 财政年份:
    2011
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: CDI-Type II: First-Principles Based Control of Multi-Scale Meta-Material Assembly Process
合作研究:CDI-Type II:基于第一原理的多尺度超材料组装过程控制
  • 批准号:
    1124678
  • 财政年份:
    2011
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
Collaborative Research: CDI-Type II: VolcanoSRI: 4D Volcano Tomography in a Large-Scale Sensor Network
合作研究:CDI-Type II:VolcanoSRI:大规模传感器网络中的 4D 火山断层扫描
  • 批准号:
    1125185
  • 财政年份:
    2011
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
CDI-TYPE II--COLLABORATIVE RESEARCH: Using Algebraic Topology to Connect Models with Measurements in Complex Nonequilibrium Systems
CDI-TYPE II——协作研究:使用代数拓扑将模型与复杂非平衡系统中的测量联系起来
  • 批准号:
    1125234
  • 财政年份:
    2011
  • 资助金额:
    $ 41.72万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了