CAREER: Probabilistic Knowledge Discovery and Data Mining: An Integrated Approach at the Interface of ComputerScience and Statistics

职业:概率知识发现和数据挖掘:计算机科学和统计学接口的综合方法

基本信息

  • 批准号:
    9703120
  • 负责人:
  • 金额:
    $ 29.34万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing Grant
  • 财政年份:
    1997
  • 资助国家:
    美国
  • 起止时间:
    1997-09-01 至 2003-08-31
  • 项目状态:
    已结题

项目摘要

This project involves the integration of ideas from computer science, mathematics, and statistics, in the context of their application to knowledge discovery and data mining of very large data sets. The project has two general research goals. The first involves the development of novel methods for exploration and identification of structure in multivariate data, with particular emphasis on clustering and density estimation. The second research goal is the development of novel methods for modeling sequential structure in data, in particular the use of graphical models to facilitate the process of model construction and estimation. The technical approach is based on the coupling of ideas from modern statistical modeling with computational techniques. A key feature of this work is the use of large-scale scientific and engineering data sets as testbeds, including upper-atmosphere spatio-temporal data records, a large medical data set consisting of heterogeneous data types for the study of Alzheimer's disease, planetary image data sets and associated annotations and catalogs of geologic features, and multivariate engineering sensor data from online system monitoring. The educational component of the project consists of the development of new courses which emphasize a first-principles understanding of model-exploration in the context of data analysis, as well as opportunities for students to participate in inter-disciplinary, large- scale exploratory data mining projects. This project can have a significant impact on how large data sets are explored and analyzed across a wide variety of scientific, medical, and business disciplines.
这个项目涉及到计算机科学、数学和统计学的思想的整合, 它们应用于知识发现和非常大的数据集的数据挖掘。项目 有两个研究目标。第一个涉及开发新的勘探方法, 多元数据结构识别,特别强调聚类和密度 估计。第二个研究目标是开发新的方法来模拟连续的 数据结构,特别是使用图形模型来促进模型构建过程 和估计。技术方法是基于现代统计建模的思想耦合 with computational计算techniques技术.这项工作的一个主要特点是使用大规模的科学和 工程数据集作为试验台,包括高层大气时空数据记录, 医学数据集,包括用于阿尔茨海默病研究的异构数据类型,行星 地质特征的成像数据集和相关注释和目录,以及多变量工程 来自在线系统监控的传感器数据。该项目的教育部分包括: 开发新的课程,强调对模型探索的第一原理理解, 数据分析的背景,以及学生参与跨学科,大规模探索性数据挖掘项目的机会。该项目可以对如何大数据集产生重大影响 在各种科学,医学和商业学科中进行探索和分析。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Padhraic Smyth其他文献

Recursive Neural Networks for Coding Therapist and Patient Behavior in Motivational Interviewing
用于编码动机访谈中治疗师和患者行为的递归神经网络
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michael J. Tanana;Kevin A. Hallgren;Zac E. Imel;David C. Atkins;Padhraic Smyth;Vivek Srikumar
  • 通讯作者:
    Vivek Srikumar
Probabilistic Model-Based Clustering of Multivariate and Sequential Data
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Padhraic Smyth
  • 通讯作者:
    Padhraic Smyth
The Distribution of Cycle Lengths in Graphical Models for Iterative Decoding
迭代解码图形模型中循环长度的分布
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xianping Ge;D. Eppstein;Padhraic Smyth
  • 通讯作者:
    Padhraic Smyth
Statistical Methods for the Forensic Analysis of Geolocated Event Data
  • DOI:
    10.1016/j.fsidi.2020.301009
  • 发表时间:
    2020-07-01
  • 期刊:
  • 影响因子:
  • 作者:
    Christopher Galbraith;Padhraic Smyth;Hal S. Stern
  • 通讯作者:
    Hal S. Stern
Pattern discovery in sequences under a Markov assumption
马尔可夫假设下的序列模式发现

Padhraic Smyth的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Padhraic Smyth', 18)}}的其他基金

RI: Medium: Assessment of Machine Learning Algorithms in the Wild
RI:媒介:机器学习算法的实际评估
  • 批准号:
    1900644
  • 财政年份:
    2019
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant
NRT-DESE: Team Science for Integrative Graduate Training in Data Science and Physical Science
NRT-DESE:数据科学和物理科学研究生综合培训的团队科学
  • 批准号:
    1633631
  • 财政年份:
    2016
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant
III: Small: Statistical Learning Algorithms for Micro-Event Time Series Data
三:小:微事件时间序列数据的统计学习算法
  • 批准号:
    1320527
  • 财政年份:
    2013
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Continuing Grant
Collaborative Research: Balancing the Portfolio: Efficiency and Productivity of Federal Biomedical R&D Funding
合作研究:平衡投资组合:联邦生物医学研究的效率和生产力
  • 批准号:
    1158699
  • 财政年份:
    2012
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant
CRI: Collaborative Research: Improving Experimental Computer Science with a Searchable Web Portal for Datasets
CRI:协作研究:通过可搜索的数据集门户网站改进实验计算机科学
  • 批准号:
    0551510
  • 财政年份:
    2006
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Continuing Grant
Statistical Data Mining of Time-Dependent Data with Applications in Geoscience and Biology
时变数据的统计数据挖掘及其在地球科学和生物学中的应用
  • 批准号:
    0431085
  • 财政年份:
    2004
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant
Data Mining of Digital Behaviour
数字行为的数据挖掘
  • 批准号:
    0083489
  • 财政年份:
    2001
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Continuing Grant
SGER: An Online Repository of Large Data Sets for Data Mining Research and Experimentation
SGER:用于数据挖掘研究和实验的大型数据集在线存储库
  • 批准号:
    9813584
  • 财政年份:
    1998
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant

相似海外基金

Probabilistic arrival time prediction algorithm using a-priori knowledge and machine learning to enable sustainable air traffic management
使用先验知识和机器学习的概率到达时间预测算法,以实现可持续的空中交通管理
  • 批准号:
    24K07723
  • 财政年份:
    2024
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Research on Evaluation Methods of Knowledge Utilization in Probabilistic Decision-Making Processes and Development of Teaching Materials for Teacher Training
概率决策过程知识运用评价方法研究及教师培训教材开发
  • 批准号:
    19K03157
  • 财政年份:
    2019
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Probabilistic knowledge representation of big data for efficient integration and useful inference in bio-medicine
大数据的概率知识表示,用于生物医学中的有效集成和有用推理
  • 批准号:
    1949035
  • 财政年份:
    2017
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Studentship
III: Small: Scalable Probabilistic Inference for Large Knowledge Bases
III:小:大型知识库的可扩展概率推理
  • 批准号:
    1614738
  • 财政年份:
    2016
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant
Improving indoor positioning accuracy in dynamic environments using semantics-based location knowledge modelling and probabilistic data analytics
使用基于语义的位置知识建模和概率数据分析提高动态环境中的室内定位精度
  • 批准号:
    507261-2016
  • 财政年份:
    2016
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Engage Grants Program
Practical Probabilistic Reasoning in Web Knowledge Graphs
网络知识图中的实用概率推理
  • 批准号:
    327259924
  • 财政年份:
    2016
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Research Grants
III: Small: Efficient Query Processing over Large Probabilistic Knowledge Bases
III:小型:大型概率知识库的高效查询处理
  • 批准号:
    1526753
  • 财政年份:
    2015
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant
RI: Small: Knowledge Representation and Reasoning under Uncertainty with Probabilistic Answer Set Programming
RI:小:不确定性下的知识表示和推理与概率答案集编程
  • 批准号:
    1526301
  • 财政年份:
    2015
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Standard Grant
The Probabilistic Representation of Linguistic Knowledge
语言知识的概率表示
  • 批准号:
    ES/J022969/1
  • 财政年份:
    2012
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Fellowship
Knowledge generation and use based on probabilistic model estimation from large-scale structured data
基于大规模结构化数据概率模型估计的知识生成和使用
  • 批准号:
    23300039
  • 财政年份:
    2011
  • 资助金额:
    $ 29.34万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了