III: Small: New Machine Learning Approaches for Modeling Time-to-Event Data

III:小型:用于对事件时间数据进行建模的新机器学习方法

基本信息

项目摘要

Due to the advancements in recent data collection technologies, different disciplines have attained the ability to not only accumulate a wide variety of data but also to monitor observations over longer periods of time. In many real-world applications, the primary goal of monitoring these observations is to better estimate the time for a particular event of interest to occur. Examples of these events include disease recurrence in healthcare, time to default in finance, device failure in engineering, etc. A major challenge with such time-to-event data is that it is often incomplete; some data instances are either removed or become unobservable over a period of time before the event occurs. Due to this missing piece of information, standard statistical and machine learning tools cannot readily be applied to analyze such data. Survival analysis methods, primarily developed by the statistics community, aim to model time-to-event data and are usually more effective compared to the standard prediction algorithms as they directly model the probability of occurrence of an event in contrast to assigning a nominal label to the data instance. More importantly, they can implicitly handle missing data. However, in many practical scenarios, the missing data challenges are compounded by several other related complexities such as the presence of correlations within the data, temporal dependencies across multiple instances (collected over a period of time), lack of available information from a single source, and difficulty in acquiring sufficient event data in a reasonable amount of time. Such data poses unique challenges to the field of predictive analytics and thus creates opportunities to develop new algorithms to tackle these issues. This project provides innovative computational methods to assist novel scientific discoveries and bring practical transformational impact to the analysis and exploration of various time-to-event datasets and applications. The proposed methods are primarily being evaluated in the context of biomedical data, but are applicable to various other forms of time-to-event data that is often seen in other disciplines such as social science, engineering, finance, and economics.This project builds novel computational and analytical algorithms that can efficiently and accurately capture the underlying predictive patterns in time-to-event data. The project aims at building new algorithms for longitudinal data analysis, integrate multiple sources while building time-to-event models, and predict temporal events with limited amount of training data. Specifically, the research objectives are to develop the following: (i) Latent feature models that can capture the longitudinal dependencies underlying multiple outcomes over a period of time. Multiple independent regression models for various missing data time windows are learned and then unified into a multi-output regression model over the diverse output space using sparsity regularizers. (ii) Multi-source time-to-event models that can effectively integrate multiple sources of information and make predictions by incorporating prior knowledge about the instances and their relationships. (iii) Bayesian methods for early-stage event prediction to tackle the problem of lack of sufficient training data on events at early stages of studies (which is a common problem in such time-to-event data). All the methods proposed in this project are evaluated using real-world biomedical data including high-dimensional genomic data and heterogeneous electronic health records. In addition, the algorithms developed in this project will also be used to tackle the problem of student retention.
由于最近数据收集技术的进步,不同学科不仅能够积累各种各样的数据,而且还能够监测更长时间的观测。在许多实际应用中,监视这些观测的主要目标是更好地估计感兴趣的特定事件发生的时间。这些事件的示例包括医疗保健中的疾病复发、财务中的违约时间、工程中的设备故障等。此类事件间隔时间数据的主要挑战是它通常是不完整的;一些数据实例在事件发生之前的一段时间内要么被删除,要么变得不可观察。由于这一信息的缺失,标准的统计和机器学习工具不能轻易地应用于分析这些数据。主要由统计界开发的生存分析方法旨在对到事件的时间数据进行建模,并且通常比标准预测算法更有效,因为与为数据实例分配名义标签相比,它们直接对事件发生的概率进行建模。更重要的是,它们可以隐式处理丢失的数据。然而,在许多实际情况下,丢失数据的挑战由于其他几个相关的复杂性而变得更加复杂,例如数据中存在相关性、跨多个实例的时间依赖关系(在一段时间内收集)、从单一来源缺乏可用的信息、以及在合理的时间内获取足够的事件数据的困难。这些数据对预测分析领域提出了独特的挑战,从而创造了开发新算法来解决这些问题的机会。该项目提供了创新的计算方法,以协助新的科学发现,并为分析和探索各种事件间隔数据集和应用程序带来实际的变革影响。建议的方法主要在生物医学数据的背景下进行评估,但也适用于在社会科学、工程学、金融学和经济学等其他学科中常见的各种其他形式的事件间隔时间数据。该项目构建了新的计算和分析算法,可以高效而准确地捕获事件间隔时间数据中潜在的预测模式。该项目旨在构建新的纵向数据分析算法,在构建事件间隔时间模型的同时集成多个来源,并使用有限的训练数据预测时间事件。具体地说,研究目标是开发以下内容:(I)能够捕捉一段时间内多种结果背后的纵向相关性的潜在特征模型。学习针对各种缺失数据时间窗口的多个独立回归模型,然后使用稀疏正则化将其统一到不同输出空间上的多输出回归模型。(2)多源时间-事件模型,该模型可以有效地集成多个信息源,并通过纳入关于实例及其关系的先验知识来进行预测。(3)早期事件预测的贝叶斯方法,以解决研究早期阶段缺乏关于事件的足够训练数据的问题(这是此类事件间隔时间数据中的一个常见问题)。本项目中提出的所有方法都使用真实世界的生物医学数据进行了评估,包括高维基因组数据和不同种类的电子健康记录。此外,本项目开发的算法还将用于解决留学生问题。

项目成果

期刊论文数量(25)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Probabilistic Topic Modeling for Comparative Analysis of Document Collections
Localized user-driven topic discovery via boosted ensemble of nonnegative matrix factorization
  • DOI:
    10.1007/s10115-017-1147-9
  • 发表时间:
    2018-09-01
  • 期刊:
  • 影响因子:
    2.7
  • 作者:
    Suh, Sangho;Shin, Sungbok;Choo, Jaegul
  • 通讯作者:
    Choo, Jaegul
Pre-Processing Censored Survival Data Using Inverse Covariance Matrix Based Calibration
使用基于逆协方差矩阵的校准来预处理删失生存数据
Adversarial Factorization Autoencoder for Look-alike Modeling
A Sparse Topic Model for Extracting Aspect-Specific Summaries from Online Reviews
  • DOI:
    10.1145/3178876.3186069
  • 发表时间:
    2018-04
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Vineeth Rakesh;Weicong Ding;Aman Ahuja;Nikhil S. Rao;Yifan Sun;Chandan K. Reddy
  • 通讯作者:
    Vineeth Rakesh;Weicong Ding;Aman Ahuja;Nikhil S. Rao;Yifan Sun;Chandan K. Reddy
{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Chandan Reddy其他文献

Freedom with Violence: Race, Sexuality, and the US State
带有暴力的自由:种族、性和美国国家
  • DOI:
    10.5860/choice.49-6145
  • 发表时间:
    2011
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chandan Reddy
  • 通讯作者:
    Chandan Reddy
Effective automatic computation placement and data allocation for parallelization of regular programs
用于常规程序并行化的有效自动计算放置和数据分配
Automatic Data Allocation, Buffer Management and Data Movement for Multi-GPU Machines
多 GPU 机器的自动数据分配、缓冲区管理和数据移动
  • DOI:
  • 发表时间:
    2014
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Thejas Ramashekar;Roshan Dathathri;Chandan Reddy
  • 通讯作者:
    Chandan Reddy
Time for Rights? Loving, Gay Marriage, and the Limits of Legal Justice
争取权利的时间到了吗?
  • DOI:
  • 发表时间:
    2008
  • 期刊:
  • 影响因子:
    0.8
  • 作者:
    Chandan Reddy
  • 通讯作者:
    Chandan Reddy
Asian Diasporas, Neoliberalism, and Family: Reviewing the Case for Homosexual Asylum in the Context of Family Rights
亚裔侨民、新自由主义和家庭:在家庭权利的背景下审查同性恋庇护案例
  • DOI:
    10.1215/01642472-23-3-4_84-85-101
  • 发表时间:
    2005
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Chandan Reddy
  • 通讯作者:
    Chandan Reddy

Chandan Reddy的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Chandan Reddy', 18)}}的其他基金

SCH: INT: Collaborative Research: Data-driven Stratification and Prognosis for Traumatic Brain Injury
SCH:INT:协作研究:数据驱动的脑外伤分层和预后
  • 批准号:
    1838730
  • 财政年份:
    2018
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
EAGER: An Integrated Predictive Modeling Framework for Crowdfunding Environments
EAGER:众筹环境的集成预测建模框架
  • 批准号:
    1646881
  • 财政年份:
    2016
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
III: Small: New Machine Learning Approaches for Modeling Time-to-Event Data
III:小型:用于对事件时间数据进行建模的新机器学习方法
  • 批准号:
    1527827
  • 财政年份:
    2015
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Student Travel Support for the 2013 SIAM International Conference on Data Mining
2013 年 SIAM 国际数据挖掘会议的学生旅行支持
  • 批准号:
    1319674
  • 财政年份:
    2013
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
EAGER: Efficient Methods for Characterizing Large-Scale Network Dynamics
EAGER:表征大规模网络动态的有效方法
  • 批准号:
    1242304
  • 财政年份:
    2012
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
SHB: Type I (EXP): Rehospitalization Analytics: Modeling and Reducing the Risks of Rehospitalization
SHB:I 类 (EXP):再住院分析:建模和降低再住院风险
  • 批准号:
    1231742
  • 财政年份:
    2012
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
  • 批准号:
    2342244
  • 财政年份:
    2024
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
SHF: SMALL: A New Semantics for Type-Level Programming in Haskell
SHF:SMALL:Haskell 中类型级编程的新语义
  • 批准号:
    2345580
  • 财政年份:
    2024
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
SHF: Small: QED - A New Approach to Scalable Verification of Hardware Memory Consistency
SHF:小型:QED - 硬件内存一致性可扩展验证的新方法
  • 批准号:
    2332891
  • 财政年份:
    2024
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
  • 批准号:
    2402572
  • 财政年份:
    2024
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
  • 批准号:
    2342245
  • 财政年份:
    2024
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
  • 批准号:
    2402571
  • 财政年份:
    2024
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Collaborative Research: SaTC: CORE: Small: Understanding the Limitations of Wireless Network Security Designs Leveraging Wireless Properties: New Threats and Defenses in Practice
协作研究:SaTC:核心:小型:了解利用无线特性的无线网络安全设计的局限性:实践中的新威胁和防御
  • 批准号:
    2316720
  • 财政年份:
    2023
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: New Directions and Approaches in Discrepancy Theory
合作研究:AF:小:差异理论的新方向和方法
  • 批准号:
    2327010
  • 财政年份:
    2023
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Collaborative Research: AF: Small: New Directions and Approaches in Discrepancy Theory
合作研究:AF:小:差异理论的新方向和方法
  • 批准号:
    2327011
  • 财政年份:
    2023
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
  • 批准号:
    2311274
  • 财政年份:
    2023
  • 资助金额:
    $ 20.26万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了