Statistical Data Mining of Time-Dependent Data with Applications in Geoscience and Biology
时变数据的统计数据挖掘及其在地球科学和生物学中的应用
基本信息
- 批准号:0431085
- 负责人:
- 金额:--
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2004
- 资助国家:美国
- 起止时间:2004-09-01 至 2009-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This project is developing novel statistical data mining methods that will help scientists to explore and understand large observational data sets. A specific focus of this research is on developing algorithms that can extract, from large data sets, models of dynamic behavior of objects over time, with an emphasis on selected data-driven problems in biology and geoscience. Examples include automated discovery of genetic regulatory mechanisms from expression measurements over time, and clustering and prediction of cyclone behavior over time. Statistical learning principles are being used to guide algorithm development and to produce publicly-available software tools. An educational component of this project is leading to an increased awareness among students of the important role of computer science and statistics in data-driven science.The results from this project have the potential for significant and broad impact in the primary focus areas of geoscience and biology, as well as in other scientific and engineering areas involving large observational data sets from dynamic processes. In the geosciences, the new algorithms can yield improved modeling and prediction of extra-tropical and tropical cyclones, reducing the socio-economic risks associated with cyclonic events and potentially provide valuable clues about possible climate change. In the biosciences, improved understanding of gene regulatory mechanisms (obtained via new network discovery algorithms) can provide the basis for significant advances in systems biology and medicine, such as the identification of the regulatory mechanisms for cancer-related genes and resultant development of gene-specific medical treatments.
该项目正在开发新的统计数据挖掘方法,帮助科学家探索和理解大型观测数据集。这项研究的一个具体重点是开发算法,可以提取,从大型数据集,模型的动态行为的对象随着时间的推移,重点是选定的数据驱动的问题,在生物学和地球科学。例子包括随着时间的推移从表达测量自动发现遗传调节机制,以及随着时间的推移聚类和预测气旋行为。统计学习原理正被用来指导算法开发和制作公开可用的软件工具。该项目的一个教育部分正在提高学生对计算机科学和统计在数据驱动的科学中的重要作用的认识,该项目的成果有可能对地球科学和生物学的主要重点领域以及涉及动态过程的大型观测数据集的其他科学和工程领域产生重大和广泛的影响。在地球科学方面,新算法可以改进热带和热带气旋的建模和预测,减少与气旋事件相关的社会经济风险,并可能提供有关可能的气候变化的有价值的线索。在生物科学中,对基因调控机制的更好理解(通过新的网络发现算法获得)可以为系统生物学和医学的重大进展提供基础,例如识别癌症相关基因的调控机制以及由此产生的基因特异性医学治疗的发展。
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Padhraic Smyth其他文献
Recursive Neural Networks for Coding Therapist and Patient Behavior in Motivational Interviewing
用于编码动机访谈中治疗师和患者行为的递归神经网络
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Michael J. Tanana;Kevin A. Hallgren;Zac E. Imel;David C. Atkins;Padhraic Smyth;Vivek Srikumar - 通讯作者:
Vivek Srikumar
Probabilistic Model-Based Clustering of Multivariate and Sequential Data
- DOI:
- 发表时间:
1999 - 期刊:
- 影响因子:0
- 作者:
Padhraic Smyth - 通讯作者:
Padhraic Smyth
The Distribution of Cycle Lengths in Graphical Models for Iterative Decoding
迭代解码图形模型中循环长度的分布
- DOI:
- 发表时间:
1999 - 期刊:
- 影响因子:0
- 作者:
Xianping Ge;D. Eppstein;Padhraic Smyth - 通讯作者:
Padhraic Smyth
Statistical Methods for the Forensic Analysis of Geolocated Event Data
- DOI:
10.1016/j.fsidi.2020.301009 - 发表时间:
2020-07-01 - 期刊:
- 影响因子:
- 作者:
Christopher Galbraith;Padhraic Smyth;Hal S. Stern - 通讯作者:
Hal S. Stern
Pattern discovery in sequences under a Markov assumption
马尔可夫假设下的序列模式发现
- DOI:
- 发表时间:
2002 - 期刊:
- 影响因子:0
- 作者:
Darya Chudova;Padhraic Smyth - 通讯作者:
Padhraic Smyth
Padhraic Smyth的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Padhraic Smyth', 18)}}的其他基金
RI: Medium: Assessment of Machine Learning Algorithms in the Wild
RI:媒介:机器学习算法的实际评估
- 批准号:
1900644 - 财政年份:2019
- 资助金额:
-- - 项目类别:
Standard Grant
NRT-DESE: Team Science for Integrative Graduate Training in Data Science and Physical Science
NRT-DESE:数据科学和物理科学研究生综合培训的团队科学
- 批准号:
1633631 - 财政年份:2016
- 资助金额:
-- - 项目类别:
Standard Grant
III: Small: Statistical Learning Algorithms for Micro-Event Time Series Data
三:小:微事件时间序列数据的统计学习算法
- 批准号:
1320527 - 财政年份:2013
- 资助金额:
-- - 项目类别:
Continuing Grant
Collaborative Research: Balancing the Portfolio: Efficiency and Productivity of Federal Biomedical R&D Funding
合作研究:平衡投资组合:联邦生物医学研究的效率和生产力
- 批准号:
1158699 - 财政年份:2012
- 资助金额:
-- - 项目类别:
Standard Grant
CRI: Collaborative Research: Improving Experimental Computer Science with a Searchable Web Portal for Datasets
CRI:协作研究:通过可搜索的数据集门户网站改进实验计算机科学
- 批准号:
0551510 - 财政年份:2006
- 资助金额:
-- - 项目类别:
Continuing Grant
SGER: An Online Repository of Large Data Sets for Data Mining Research and Experimentation
SGER:用于数据挖掘研究和实验的大型数据集在线存储库
- 批准号:
9813584 - 财政年份:1998
- 资助金额:
-- - 项目类别:
Standard Grant
CAREER: Probabilistic Knowledge Discovery and Data Mining: An Integrated Approach at the Interface of ComputerScience and Statistics
职业:概率知识发现和数据挖掘:计算机科学和统计学接口的综合方法
- 批准号:
9703120 - 财政年份:1997
- 资助金额:
-- - 项目类别:
Continuing Grant
相似国自然基金
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:外国青年学者研究基金项目
Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
- 批准号:
- 批准年份:2024
- 资助金额:万元
- 项目类别:合作创新研究团队
Development of a Linear Stochastic Model for Wind Field Reconstruction from Limited Measurement Data
- 批准号:
- 批准年份:2020
- 资助金额:40 万元
- 项目类别:
基于Linked Open Data的Web服务语义互操作关键技术
- 批准号:61373035
- 批准年份:2013
- 资助金额:77.0 万元
- 项目类别:面上项目
Molecular Interaction Reconstruction of Rheumatoid Arthritis Therapies Using Clinical Data
- 批准号:31070748
- 批准年份:2010
- 资助金额:34.0 万元
- 项目类别:面上项目
高维数据的函数型数据(functional data)分析方法
- 批准号:11001084
- 批准年份:2010
- 资助金额:16.0 万元
- 项目类别:青年科学基金项目
染色体复制负调控因子datA在细胞周期中的作用
- 批准号:31060015
- 批准年份:2010
- 资助金额:25.0 万元
- 项目类别:地区科学基金项目
Computational Methods for Analyzing Toponome Data
- 批准号:60601030
- 批准年份:2006
- 资助金额:17.0 万元
- 项目类别:青年科学基金项目
相似海外基金
III: Small: Novel Statistical Data Analysis Approaches for Mining Human Genetics Datasets
III:小型:挖掘人类遗传学数据集的新颖统计数据分析方法
- 批准号:
1715202 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Standard Grant
Statistical Data Mining for Medical Image Data Analysis
医学图像数据分析的统计数据挖掘
- 批准号:
1851762 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Studentship
REU Site: Interdisciplinary Integration in Statistical Learning and Data Mining
REU 网站:统计学习和数据挖掘的跨学科整合
- 批准号:
1659288 - 财政年份:2017
- 资助金额:
-- - 项目类别:
Standard Grant
Development of statistical methods for large scale somatic mutation data mining
大规模体细胞突变数据挖掘统计方法的开发
- 批准号:
15K00398 - 财政年份:2015
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (C)
Conference on Statistical Learning and Data Mining
统计学习与数据挖掘会议
- 批准号:
1203216 - 财政年份:2012
- 资助金额:
-- - 项目类别:
Standard Grant
Time series, statistical computing, data mining
时间序列、统计计算、数据挖掘
- 批准号:
3465-2011 - 财政年份:2011
- 资助金额:
-- - 项目类别:
Discovery Grants Program - Individual
Establishment of Statistical Estimation Principle for Super HighDimensional Data and Its Application to Large Scale Data Mining
超高维数据统计估计原理的建立及其在大规模数据挖掘中的应用
- 批准号:
22300054 - 财政年份:2010
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
CAREER: New Statistical Methodology and Theory for Mining High-Dimensional Data
职业:挖掘高维数据的新统计方法和理论
- 批准号:
0846068 - 财政年份:2009
- 资助金额:
-- - 项目类别:
Continuing Grant
Generating networked knowledge based on statistical modeling and data mining techniques and its applications
基于统计建模和数据挖掘技术的网络知识生成及其应用
- 批准号:
20300038 - 财政年份:2008
- 资助金额:
-- - 项目类别:
Grant-in-Aid for Scientific Research (B)
Study and comparison of computational intelligence (CI) techniques and statistiques and statistical approaches to data mining
计算智能(CI)技术和统计以及数据挖掘统计方法的研究和比较
- 批准号:
347820-2008 - 财政年份:2008
- 资助金额:
-- - 项目类别:
Postgraduate Scholarships - Master's