III: Small: Collaborative Research: Efficient, Nonparametric and Local-Minimum-Free Latent Variable Models: With Application to Large-Scale Computer Vision and Genomics
III:小型:协作研究:高效、非参数和局部最小自由潜变量模型:应用于大规模计算机视觉和基因组学
基本信息
- 批准号:1218749
- 负责人:
- 金额:$ 30万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Continuing Grant
- 财政年份:2012
- 资助国家:美国
- 起止时间:2012-10-01 至 2017-09-30
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Many modern applications ranging from computer vision to biology require modeling and inferring high-dimensional continuous variables based on distributions with multimodality, skewness, and rich latent structures. Most existing models in this regime rely heavily on parametric assumptions where the components of the model are typically assumed to be discrete or multivariate Gaussian, or the relations between variables are linear, which may be very different from the actual data generating processes. Furthermore, existing algorithms for discovering the latent dependency structures and learning the latent parameters largely are restricted to local search heuristics such as expectation maximization. Conclusions inferred under these restricted assumptions and suboptimal solutions can be misleading, if the underlying assumptions are violated or if the suboptimal solutions differ greatly from the globally optimal ones. This project aims to develop a novel framework which can (i) discover and take advantage of latent structures in the data, while (ii) allowing parts to handle near-arbitrary distributions, and (iii) allowing the models to scale to modern massive datasets in a local-minimum-free fashion. The key innovation in the project is a novel nonparametric latent variable modeling framework based on kernel embedding of distributions. The basic idea is to map distributions into infinite dimensional feature spaces using kernels, such that subsequent comparisons and manipulations of distributions can be achieved via feature space operations, such as inner products, distances, projections, linear transformations and spectral analysis. Conceptually, the framework represents components from latent variable models, such as marginal distributions over a single variable, joint distributions over variable pairs, triplets and more variables, as infinite dimensional vectors, matrices, tensors and high-order tensors respectively. Probabilistic relations between these components, i.e., conditional distributions, Sum Rule, Product Rule etc. become linear transformations and relations between these feature space components.The framework supports modeling data with diverse statistical features without the need for making restrictive assumptions about the type of distributions and relations. It supports the application of a large pool of linear and multi-linear algebraic (tensor) tools for addressing challenging graphical model problems in the presence of latent variables, including structure discovery, inference, parameter learning and latent feature extraction. The framework applies not only to general continuous variables, but also to variables that take values on strings, graphs, groups, compact manifolds, and other domains on which kernels may be defined.Besides advancing the state of the art in machine learning,the new non-parametric methods resulting from the project find applications in image data and understanding and gene expression data analysis. It also contributes to research-based training of graduate and undergraduate students at Georgia Tech and CMU.
从计算机视觉到生物学的许多现代应用都需要基于具有多模态、偏度和丰富潜在结构的分布来建模和推断高维连续变量。该体系中的大多数现有模型严重依赖于参数假设,其中模型的组成部分通常被假设为离散或多元高斯,或者变量之间的关系是线性的,这可能与实际的数据生成过程有很大不同。此外,现有的发现潜在依赖结构和学习潜在参数的算法在很大程度上局限于期望最大化等局部搜索启发式算法。在这些受限假设和次优解下得出的结论可能会误导,如果基本假设被违反,或者次优解与全局最优解相差很大。该项目旨在开发一种新的框架,该框架可以(i)发现并利用数据中的潜在结构,同时(ii)允许部分处理近乎任意的分布,以及(iii)允许模型以局部最小自由的方式扩展到现代大规模数据集。该项目的关键创新是一种基于分布核嵌入的非参数潜变量建模框架。基本思想是使用核将分布映射到无限维的特征空间,这样分布的后续比较和操作可以通过特征空间操作来实现,如内积、距离、投影、线性变换和谱分析。从概念上讲,该框架将潜在变量模型中的分量,如单变量的边际分布、变量对、三元组和更多变量的联合分布,分别表示为无限维向量、矩阵、张量和高阶张量。这些成分之间的概率关系,即条件分布、求和规则、乘积规则等,成为这些特征空间成分之间的线性变换和关系。该框架支持对具有不同统计特征的数据进行建模,而无需对分布和关系的类型做出限制性假设。它支持大量线性和多线性代数(张量)工具的应用,用于解决存在潜在变量的具有挑战性的图形模型问题,包括结构发现、推理、参数学习和潜在特征提取。该框架不仅适用于一般的连续变量,还适用于在字符串、图、群、紧流形和其他可以定义内核的领域上取值的变量。除了推进机器学习的最新技术,该项目产生的新的非参数方法在图像数据和理解以及基因表达数据分析中也有应用。它还为佐治亚理工学院和CMU的研究生和本科生的研究培训做出了贡献。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Le Song其他文献
Real-time 3D Finger Pointing for an Augmented Desk
增强办公桌的实时 3D 手指指向
- DOI:
- 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Le Song;M. Takatsuka - 通讯作者:
M. Takatsuka
MSAGPT: Neural Prompting Protein Structure Prediction via MSA Generative Pre-Training
MSAGPT:通过 MSA 生成预训练进行神经提示蛋白质结构预测
- DOI:
- 发表时间:
2024 - 期刊:
- 影响因子:0
- 作者:
Bo Chen;Zhilei Bei;Xingyi Cheng;Pan Li;Jie Tang;Le Song - 通讯作者:
Le Song
The BAHSIC family of gene selection algorithms
BAHSIC 系列基因选择算法
- DOI:
- 发表时间:
2006 - 期刊:
- 影响因子:0
- 作者:
Le Song;J. Bedő;Karsten M. Borgwardt;A. Gretton;Alex Smola - 通讯作者:
Alex Smola
Antibacterial evaluation of cotton textile treated by trialkoxysilane compounds with antimicrobial moiety
含抗菌基团的三烷氧基硅烷化合物处理棉纺织品的抗菌评价
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Le Song;R. Baney - 通讯作者:
R. Baney
Kernel Belief Propagation
核置信传播
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Le Song;A. Gretton;Danny Bickson;Yucheng Low;Carlos Guestrin - 通讯作者:
Carlos Guestrin
Le Song的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Le Song', 18)}}的其他基金
FMitF: Collaborative Research: Synergies between Program Synthesis and Neural Learning of Graph Structures
FMITF:协作研究:程序综合与图结构神经学习之间的协同作用
- 批准号:
1836822 - 财政年份:2019
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322973 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: High-Performance Scheduling for Modern Database Systems
协作研究:III:小型:现代数据库系统的高性能调度
- 批准号:
2322974 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336769 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: A DREAM Proactive Conversational System
合作研究:III:小型:一个梦想的主动对话系统
- 批准号:
2336768 - 财政年份:2024
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
III: Small: Multiple Device Collaborative Learning in Real Heterogeneous and Dynamic Environments
III:小:真实异构动态环境中的多设备协作学习
- 批准号:
2311990 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
- 批准号:
2324770 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Physics Guided Graph Networks for Modeling Water Dynamics in Freshwater Ecosystems
合作研究:III:小型:用于模拟淡水生态系统中水动力学的物理引导图网络
- 批准号:
2316306 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
- 批准号:
2311596 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Efficient and Robust Multi-model Data Analytics for Edge Computing
协作研究:III:小型:边缘计算的高效、稳健的多模型数据分析
- 批准号:
2311598 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant
Collaborative Research: III: Small: Reconstruction of Diffusion History in Cyber and Human Networks with Applications in Epidemiology and Cybersecurity
合作研究:III:小:重建网络和人类网络中的扩散历史及其在流行病学和网络安全中的应用
- 批准号:
2324769 - 财政年份:2023
- 资助金额:
$ 30万 - 项目类别:
Standard Grant














{{item.name}}会员




