III: Small: New Machine Learning Approaches for Modeling Time-to-Event Data
III:小型:用于对事件时间数据进行建模的新机器学习方法
基本信息
- 批准号:1527827
- 负责人:
- 金额:$ 31.05万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-09-01 至 2016-12-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Due to the advancements in recent data collection technologies, different disciplines have attained the ability to not only accumulate a wide variety of data but also to monitor observations over longer periods of time. In many real-world applications, the primary goal of monitoring these observations is to better estimate the time for a particular event of interest to occur. Examples of these events include disease recurrence in healthcare, time to default in finance, device failure in engineering, etc. A major challenge with such time-to-event data is that it is often incomplete; some data instances are either removed or become unobservable over a period of time before the event occurs. Due to this missing piece of information, standard statistical and machine learning tools cannot readily be applied to analyze such data. Survival analysis methods, primarily developed by the statistics community, aim to model time-to-event data and are usually more effective compared to the standard prediction algorithms as they directly model the probability of occurrence of an event in contrast to assigning a nominal label to the data instance. More importantly, they can implicitly handle missing data. However, in many practical scenarios, the missing data challenges are compounded by several other related complexities such as the presence of correlations within the data, temporal dependencies across multiple instances (collected over a period of time), lack of available information from a single source, and difficulty in acquiring sufficient event data in a reasonable amount of time. Such data poses unique challenges to the field of predictive analytics and thus creates opportunities to develop new algorithms to tackle these issues. This project provides innovative computational methods to assist novel scientific discoveries and bring practical transformational impact to the analysis and exploration of various time-to-event datasets and applications. The proposed methods are primarily being evaluated in the context of biomedical data, but are applicable to various other forms of time-to-event data that is often seen in other disciplines such as social science, engineering, finance, and economics.This project builds novel computational and analytical algorithms that can efficiently and accurately capture the underlying predictive patterns in time-to-event data. The project aims at building new algorithms for longitudinal data analysis, integrate multiple sources while building time-to-event models, and predict temporal events with limited amount of training data. Specifically, the research objectives are to develop the following: (i) Latent feature models that can capture the longitudinal dependencies underlying multiple outcomes over a period of time. Multiple independent regression models for various missing data time windows are learned and then unified into a multi-output regression model over the diverse output space using sparsity regularizers. (ii) Multi-source time-to-event models that can effectively integrate multiple sources of information and make predictions by incorporating prior knowledge about the instances and their relationships. (iii) Bayesian methods for early-stage event prediction to tackle the problem of lack of sufficient training data on events at early stages of studies (which is a common problem in such time-to-event data). All the methods proposed in this project are evaluated using real-world biomedical data including high-dimensional genomic data and heterogeneous electronic health records. In addition, the algorithms developed in this project will also be used to tackle the problem of student retention.
由于最近数据收集技术的进步,不同学科不仅有能力积累各种数据,而且有能力在较长时间内监测观测结果。在许多实际应用中,监视这些观测的主要目标是更好地估计特定感兴趣事件发生的时间。这些事件的示例包括医疗保健中的疾病复发、金融中的违约时间、工程中的设备故障等。此类事件发生时间数据的一个主要挑战是它通常不完整;一些数据实例在事件发生前的一段时间内被删除或变得不可观察。由于这一信息缺失,标准的统计和机器学习工具无法轻易应用于分析此类数据。生存分析方法主要由统计界开发,旨在对事件时间数据进行建模,并且通常比标准预测算法更有效,因为它们直接对事件发生的概率进行建模,而不是将标称标签分配给数据实例。更重要的是,它们可以隐式地处理丢失的数据。然而,在许多实际场景中,缺失数据的挑战会因其他几个相关的复杂性而加剧,例如数据中存在相关性,多个实例之间的时间依赖性(在一段时间内收集),缺乏来自单一来源的可用信息,以及难以在合理的时间内获取足够的事件数据。这些数据对预测分析领域提出了独特的挑战,从而为开发新算法来解决这些问题创造了机会。 该项目提供创新的计算方法,以协助新的科学发现,并为各种时间到事件数据集和应用程序的分析和探索带来实际的变革性影响。 所提出的方法主要在生物医学数据的背景下进行评估,但也适用于其他学科中常见的各种其他形式的时间到事件数据,如社会科学,工程,金融和经济学。该项目构建了新颖的计算和分析算法,可以有效准确地捕获时间到事件数据中的潜在预测模式。该项目旨在构建用于纵向数据分析的新算法,在构建时间到事件模型的同时集成多个源,并使用有限的训练数据预测时间事件。具体而言,研究目标是开发以下内容:(i)潜在特征模型,可以捕获一段时间内多个结果的纵向依赖关系。学习各种缺失数据时间窗口的多个独立回归模型,然后使用稀疏正则化器将其统一为不同输出空间上的多输出回归模型。(ii)多源时间事件模型,可以有效地集成多个信息源,并通过合并有关实例及其关系的先验知识进行预测。(iii)贝叶斯方法用于早期事件预测,以解决研究早期阶段缺乏足够的事件训练数据的问题(这是此类事件时间数据中的常见问题)。在这个项目中提出的所有方法都使用真实世界的生物医学数据,包括高维基因组数据和异构电子健康记录进行评估。此外,该项目中开发的算法也将用于解决学生保留问题。
项目成果
期刊论文数量(5)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
A Bayesian Perspective on Early Stage Event Prediction in Longitudinal Data
- DOI:10.1109/tkde.2016.2608347
- 发表时间:2016-12-01
- 期刊:
- 影响因子:8.9
- 作者:Fard, Mahtab Jahanbani;Wang, Ping;Reddy, Chandan K.
- 通讯作者:Reddy, Chandan K.
Project Success Prediction in Crowdfunding Environments
- DOI:10.1145/2835776.2835791
- 发表时间:2016-02
- 期刊:
- 影响因子:0
- 作者:Yan Li;Vineeth Rakesh;Chandan K. Reddy
- 通讯作者:Yan Li;Vineeth Rakesh;Chandan K. Reddy
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Chandan Reddy其他文献
Freedom with Violence: Race, Sexuality, and the US State
带有暴力的自由:种族、性和美国国家
- DOI:
10.5860/choice.49-6145 - 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
Chandan Reddy - 通讯作者:
Chandan Reddy
Effective automatic computation placement and data allocation for parallelization of regular programs
用于常规程序并行化的有效自动计算放置和数据分配
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Chandan Reddy;Uday Bondhugula - 通讯作者:
Uday Bondhugula
Automatic Data Allocation, Buffer Management and Data Movement for Multi-GPU Machines
多 GPU 机器的自动数据分配、缓冲区管理和数据移动
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:0
- 作者:
Thejas Ramashekar;Roshan Dathathri;Chandan Reddy - 通讯作者:
Chandan Reddy
Time for Rights? Loving, Gay Marriage, and the Limits of Legal Justice
争取权利的时间到了吗?
- DOI:
- 发表时间:
2008 - 期刊:
- 影响因子:0.8
- 作者:
Chandan Reddy - 通讯作者:
Chandan Reddy
Asian Diasporas, Neoliberalism, and Family: Reviewing the Case for Homosexual Asylum in the Context of Family Rights
亚裔侨民、新自由主义和家庭:在家庭权利的背景下审查同性恋庇护案例
- DOI:
10.1215/01642472-23-3-4_84-85-101 - 发表时间:
2005 - 期刊:
- 影响因子:0
- 作者:
Chandan Reddy - 通讯作者:
Chandan Reddy
Chandan Reddy的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Chandan Reddy', 18)}}的其他基金
SCH: INT: Collaborative Research: Data-driven Stratification and Prognosis for Traumatic Brain Injury
SCH:INT:协作研究:数据驱动的脑外伤分层和预后
- 批准号:
1838730 - 财政年份:2018
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
EAGER: An Integrated Predictive Modeling Framework for Crowdfunding Environments
EAGER:众筹环境的集成预测建模框架
- 批准号:
1646881 - 财政年份:2016
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
III: Small: New Machine Learning Approaches for Modeling Time-to-Event Data
III:小型:用于对事件时间数据进行建模的新机器学习方法
- 批准号:
1707498 - 财政年份:2016
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Student Travel Support for the 2013 SIAM International Conference on Data Mining
2013 年 SIAM 国际数据挖掘会议的学生旅行支持
- 批准号:
1319674 - 财政年份:2013
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
EAGER: Efficient Methods for Characterizing Large-Scale Network Dynamics
EAGER:表征大规模网络动态的有效方法
- 批准号:
1242304 - 财政年份:2012
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
SHB: Type I (EXP): Rehospitalization Analytics: Modeling and Reducing the Risks of Rehospitalization
SHB:I 类 (EXP):再住院分析:建模和降低再住院风险
- 批准号:
1231742 - 财政年份:2012
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342244 - 财政年份:2024
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
SHF: SMALL: A New Semantics for Type-Level Programming in Haskell
SHF:SMALL:Haskell 中类型级编程的新语义
- 批准号:
2345580 - 财政年份:2024
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
SHF: Small: QED - A New Approach to Scalable Verification of Hardware Memory Consistency
SHF:小型:QED - 硬件内存一致性可扩展验证的新方法
- 批准号:
2332891 - 财政年份:2024
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402572 - 财政年份:2024
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions in Algorithmic Replicability
合作研究:AF:小:算法可复制性的新方向
- 批准号:
2342245 - 财政年份:2024
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Connections between Optimization and Property Testing
合作研究:AF:小型:优化和性能测试之间的新联系
- 批准号:
2402571 - 财政年份:2024
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions and Approaches in Discrepancy Theory
合作研究:AF:小:差异理论的新方向和方法
- 批准号:
2327010 - 财政年份:2023
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Collaborative Research: AF: Small: New Directions and Approaches in Discrepancy Theory
合作研究:AF:小:差异理论的新方向和方法
- 批准号:
2327011 - 财政年份:2023
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Collaborative Research: SaTC: CORE: Small: Understanding the Limitations of Wireless Network Security Designs Leveraging Wireless Properties: New Threats and Defenses in Practice
协作研究:SaTC:核心:小型:了解利用无线特性的无线网络安全设计的局限性:实践中的新威胁和防御
- 批准号:
2316720 - 财政年份:2023
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant
Collaborative Research: CIF: Small: New Theory, Algorithms and Applications for Large-Scale Bilevel Optimization
合作研究:CIF:小型:大规模双层优化的新理论、算法和应用
- 批准号:
2311274 - 财政年份:2023
- 资助金额:
$ 31.05万 - 项目类别:
Standard Grant














{{item.name}}会员




