Statistical Inference for Complex Data

复杂数据的统计推断

基本信息

项目摘要

The advent of computers is routinely bringing large, very large datasets for analysis. How to analyze theattendant data and/or how to glean useful information from these data is anything but routine. This proposal investigates two broad areas, viz., mixture decomposition, and regression in the presence of taxonomy and hierarchical variables. The mixture decomposition work is concerned with data in which the observation is a distribution function in the p-dimensional Cartesian product of distributions space, rather than the single point in p-dimensional space of classical data. Such data arise naturally, or after aggregation of original data to a more manageable size yet retaining its inherent information. A goal is to partition these distributions into coherent classes and to estimate the relevant class distributions. It is proposed to adapt ideas from copula theory for classical data, to data comprised of distributions. Embedded in this process is the need to study parameter estimation. Different partitioning techniques will be explored such as dynamical clustering, different measures of fit criterion will be considered, e.g., log-likelihood classification; and different estimation methods explored for the underlying copulas and the associated distributions and their parameters, e.g., maximum likelihood, nonparametric methods such as Parzen's truncated window. The resulting methodology will have wide applicability to those datasets generated in, e.g., meteorology, environmental science, social sciences, health-care programs, and the like. Regression methods when taxonomy variables, and when hierarchical variables, are present will also be developed. This will first be executed for classical data, and then extended to interval-valued data and to histogram- (or frequency-) valued data.With modern computers generating very large datasets, it is imperativethat techniques be developed for analysing such datasets. To date veryfew methods exist. The research will develop new methodologies foranalysing these data. A first step is to aggregate the data in somewell-defined but meaningful way. This aggregation will thence producedata in the form of lists, intervals, or distributions, and these datawill now have some form of internal structure. The research will focuson such data of two types. One will be where the data now consist ofdistributions, and where the goal is to develop methods to identify theappropraite mixture of distributions that describe these data. Anotherdeals with taxonomy and hierarical data, with the goal of establishingregression relationships that will explain the underlying processgoverning the variables involved. The resulting methodologies willallow analysis and interpretation of contemporary datastes wherecurrently no methods exist.
计算机的出现通常会带来大型的,非常大的数据集进行分析。 如何分析伴随的数据和/或如何从这些数据中收集有用的信息是任何事情,但例行。这项建议涉及两个广泛的领域,即:混合物分解和回归分类和层次变量的存在。 混合分解工作涉及的数据中的观察是分布空间的p维笛卡尔积中的分布函数,而不是经典数据的p维空间中的单点。 这些数据是自然产生的,或者是在将原始数据聚合到更易于管理的大小但保留其固有信息之后产生的。一个目标是将这些分布划分为连贯的类,并估计相关的类分布。 它提出了适应的想法,从Copula理论的经典数据,数据组成的分布。 嵌入在这个过程中的是需要研究参数估计。 将探索不同的划分技术,例如动态聚类,将考虑不同的拟合标准度量,例如,对数似然分类;以及为基础Copula和相关分布及其参数探索的不同估计方法,例如,最大似然法,非参数法,如Parzen截断窗。 由此产生的方法将具有广泛的适用性,这些数据集产生的,例如,气象学、环境科学、社会科学、保健计划等。 还将开发分类变量和分层变量存在时的回归方法。 这将首先对经典数据执行,然后扩展到区间值数据和直方图(或频率)值数据。随着现代计算机生成非常大的数据集,迫切需要开发分析此类数据集的技术。到目前为止,存在的方法很少。这项研究将开发新的方法来分析这些数据。第一步是以某种定义明确但有意义的方式聚合数据。这种聚合将产生列表、间隔或分布形式的数据,这些数据现在将具有某种形式的内部结构。研究将集中在两种类型的数据。一个是数据现在由分布组成,目标是开发方法来识别描述这些数据的适当分布混合。另一个涉及分类学和层次数据,目的是建立回归关系,解释控制所涉及变量的基本过程。由此产生的方法将允许分析和解释的当代marticles wherecurrently没有方法存在。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Lynne Billard其他文献

Hierarchical clustering for histogram data
直方图数据的层次聚类
span style=font-family:quot;Times New Romanquot;,serif;font-size:12pt;Principal Component Analysis for Compositional Data Vectors/span
成分数据向量的主成分分析
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    1.3
  • 作者:
    Huiwen Wang;Liying Shangguan;Rong Guan;Lynne Billard
  • 通讯作者:
    Lynne Billard
On a matrix‐valued autoregressive model
矩阵值自回归模型
Dissimilarity Measures for Histogram-valued Observations
直方图值观测值的相异性测量

Lynne Billard的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Lynne Billard', 18)}}的其他基金

Symbolic Inference for Very Large Datasets
非常大的数据集的符号推理
  • 批准号:
    0805245
  • 财政年份:
    2008
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Workshop: Pathways to the Future Workshop 2004
研讨会:未来之路研讨会 2004
  • 批准号:
    0400585
  • 财政年份:
    2004
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Pathways to the Future Workshop 2003
未来之路研讨会 2003
  • 批准号:
    0307631
  • 财政年份:
    2003
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
U.S.-France Cooperative Research (INRIA): Symbolic Data Analysis Project
美法合作研究(INRIA):符号数据分析项目
  • 批准号:
    0093738
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Workshops: Pathways to the Future
研讨会:通往未来的道路
  • 批准号:
    0102306
  • 财政年份:
    2001
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
International Biometric Conference - San Francisco
国际生物识别会议 - 旧金山
  • 批准号:
    0070176
  • 财政年份:
    2000
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
International Biometric Conference to be held December 13-18, 1998, in Cape Town, South Africa
国际生物识别会议将于1998年12月13日至18日在南非开普敦举行
  • 批准号:
    9730906
  • 财政年份:
    1998
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Mathematical Sciences: Workshop: Statistical Image Analysis - July 1-5, 1996
数学科学:研讨会:统计图像分析 - 1996 年 7 月 1-5 日
  • 批准号:
    9626865
  • 财政年份:
    1996
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Workshops: Pathways to the Future
研讨会:通往未来的道路
  • 批准号:
    9629283
  • 财政年份:
    1996
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Mathematical Sciences: International Biometric Conference
数学科学:国际生物识别会议
  • 批准号:
    9628290
  • 财政年份:
    1996
  • 资助金额:
    --
  • 项目类别:
    Standard Grant

相似海外基金

Unravel machine learning blackboxes -- A general, effective and performance-guaranteed statistical framework for complex and irregular inference problems in data science
揭开机器学习黑匣子——针对数据科学中复杂和不规则推理问题的通用、有效和性能有保证的统计框架
  • 批准号:
    2311064
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Novel and Rigorous Statistical Learning and Inference for Comparative Effectiveness Research with Complex Data
复杂数据比较有效性研究的新颖而严格的统计学习和推理
  • 批准号:
    10635323
  • 财政年份:
    2023
  • 资助金额:
    --
  • 项目类别:
Statistical Inference for Complex Temporal Systems: Non-stationarity, High Dimensionality And Beyond.
复杂时态系统的统计推断:非平稳性、高维性及其他。
  • 批准号:
    RGPIN-2021-02715
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Statistical Inference and Modelling for Complex Data
复杂数据的统计推断和建模
  • 批准号:
    RGPIN-2018-06459
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Topics in Statistical Modelling and Inference with High-Dimensional, Complex Data
高维、复杂数据的统计建模和推理主题
  • 批准号:
    RGPIN-2017-05720
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Statistical Inference for Complex Temporal Systems: Non-stationarity, High Dimensionality And Beyond.
复杂时态系统的统计推断:非平稳性、高维性及其他。
  • 批准号:
    RGPAS-2021-00036
  • 财政年份:
    2022
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Statistical inference and planning for complex infectious disease systems
复杂传染病系统的统计推断和规划
  • 批准号:
    RGPIN-2015-04779
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Excellence in Research: Statistical Network Modeling and Inference for Complex Data
卓越的研究:复杂数据的统计网络建模和推理
  • 批准号:
    2100729
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Standard Grant
Statistical Inference and Modelling for Complex Data
复杂数据的统计推断和建模
  • 批准号:
    RGPIN-2018-06459
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
Statistical Modelling and Inference with Complex Data
复杂数据的统计建模和推理
  • 批准号:
    RGPIN-2016-04346
  • 财政年份:
    2021
  • 资助金额:
    --
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了