SGER: Finding Interesting Patterns through Analysis of Complex Prediction Models

SGER:通过分析复杂的预测模型寻找有趣的模式

基本信息

  • 批准号:
    0920869
  • 负责人:
  • 金额:
    $ 5.6万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2009
  • 资助国家:
    美国
  • 起止时间:
    2009-01-01 至 2010-02-28
  • 项目状态:
    已结题

项目摘要

With data mining techniques it is possible to train accurate prediction models for large high-dimensional data. Unfortunately, complex prediction models per se are not easy to understand. To make them 'digestible', analysts need simpler patterns that summarize the complex functions extracted by the model. The number of such function summaries is overwhelming. Each slice of a lower-dimensional subspace of the original data space could contain an interesting function summary.The goal of this project is to develop techniques for finding the most 'interesting' function summaries automatically and efficiently. This is done in three steps. First, by formalizing the notion of interestingness for a wide variety of pattern types. Second, by developing a declarative language for specifying these interestingness measures. With a declarative language analysts define what they find interesting, but they need not specify how to find it efficiently. Third, an optimizing compiler for a small language fragment handles the performance efficiency. A major research challenge is to strike the right balance between expressiveness of the language and making it amenable to effective query optimization.The results of this project will pave the way for powerful exploratory analysis tools. They will also enable future research on optimizers and user-friendly interfaces for the declarative language. The approach will be validated using the rich data resources being organized by the ornithological community in the Avian Knowledge Network (AKN). This will have a tremendous impact on the ability to identify the most significant environmental variables that affect biodiversity on the planet. For example, land managers could discover the possible impact of their decisions on an ecosystem's health.A component of the language will be available to the public through Web services on the AKN Web site (http://www.avianknowledge.net/content). Additional results will be disseminated through the project Web site (http://www.cs.cornell.edu/~mirek/Projects/FunctionSummaries). This will enable a broad audience, from researchers to land managers or bird watchers, teachers or school children to derive novel knowledge from the data resources gathered.
通过数据挖掘技术,可以为大量高维数据训练准确的预测模型。不幸的是,复杂的预测模型本身并不容易理解。为了使它们“易于理解”,分析师需要更简单的模式来总结模型提取的复杂函数。此类函数摘要的数量是巨大的。原始数据空间的低维子空间的每个切片都可以包含一个有趣的函数摘要。该项目的目标是开发自动有效地查找最“有趣”的函数摘要的技术。这分三步完成。首先,通过形式化各种模式类型的兴趣度概念。其次,通过开发一种声明性语言来指定这些兴趣度度量。使用声明性语言,分析师可以定义他们感兴趣的内容,但不需要指定如何有效地找到它。第三,针对小语言片段的优化编译器处理性能效率。一个主要的研究挑战是在语言的表达能力和使其适合有效的查询优化之间取得适当的平衡。该项目的结果将为强大的探索性分析工具铺平道路。它们还将使未来对声明性语言的优化器和用户友好界面的研究成为可能。该方法将使用鸟类知识网络 (AKN) 中鸟类学界组织的丰富数据资源进行验证。这将对识别影响地球生物多样性的最重要环境​​变量的能力产生巨大影响。例如,土地管理者可以发现他们的决策对生态系统健康可能产生的影响。该语言的一个组成部分将通过 AKN 网站 (http://www.avianknowledge.net/content) 上的 Web 服务向公众开放。其他结果将通过项目网站 (http://www.cs.cornell.edu/~mirek/Projects/FunctionSummaries) 传播。这将使广泛的受众,从研究人员到土地管理者或鸟类观察者、教师或学童,能够从收集的数据资源中获得新颖的知识。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Mirek Riedewald其他文献

Space-Efficient Data Cubes for Dynamic Environments
适用于动态环境的节省空间的数据立方体
Data Cubes in Dynamic Environments
动态环境中的数据立方体
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Geffner;Mirek Riedewald;D. Agrawal;A. E. Abbadi
  • 通讯作者:
    A. E. Abbadi
Data Gathering
数据收集
  • DOI:
    10.1007/978-0-387-39940-9_2355
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    T. Risch;Turkmen Canli;A. Khokhar;Jun Yang;Kamesh Munagala;Adam Silberstein;P. Chrysanthis;E. Pitoura;Venkatesh Ganti;Amol Deshpande;H. Do;James Caverlee;Ninghui Li;L. Gruenwald;Lucian Popa;A. Kansal;Feng Zhao;A. Poulovassilis;M. Herzog;Il;Jiawei Han;Daniel J. Abadi;David P. Hansen;Christine O’Keefe;Theodore Johnson;Amarnath Gupta;C. Batini;K. Sattler;M. Scannapieco;J. Domingo;Rui Zhang;B. Kemme;Qing Zhang;Xuemin Lin;Luc Bouganim;Philip B. Gibbons;Lukasz Golab;Yanif Ahmad;U. Çetintemel;S. Prabhakar;R. Cheng;H. Hinterberger;M. Golfarelli;J. Eder;Karl Wiggisser;Panos Vassiliadis;C. Blanco;E. Fernández;Juan Trujillo;M. Piattini;Shawn N. Murphy;E. Chen;Changqing Li;Xue Li;M. Mattoso;M. Gyssens;J. Mylopoulos;S. Madden;K. Goda;Pat Helland;C. Amza;L. Bertossi;Jean;J. Henrard;V. Englebert;D. Roland;Jean;Elena Ferrari;Biswanath Panda;J. Gehrke;Mirek Riedewald;Mikael Berndtsson;J. Mellin;Surajit Chaudhuri;Vivek R. Narasayya;G. Weikum;Nicolas Bruno;Grigoris Karvounarakis;A. Gokhale;E. Cohen;T. Lin;Alin Dobra;Timothy Roscoe;T. Lin;R. Kaushik;K. Chang;M. Moro;V. Tsotras;Daniel A. Keim;Peter Bak;Matthias Schäfer;M. Ester;A. Borgida;A. Maurino;P. Mitra;Cristina Sirangelo;R.W. Moore;G. Janée;L. Floriani;P. Magillo;V. Srinivasan;Seungwon Yang;Edward A. Fox;Radu Sion;B. Carminati;T. Pedersen;H. Shen;Chris H. Q. Ding;E. Clementini;A. Blackwell;M. Costabile;K. Wada;K. Järvelin;Jaana Kekäläinen;S. Dustdar;Christian Platzer;Bernd J. Krämer;Minos N. Garofalakis;Gail;P. Boncz;Carpendale Sheelagh;M. Weske;Kian;S. Elnikety;W. Tok;Wojciech Galuba;Sarunas Girdzijauskas;Stéphane Bressan;Panos Kalnis;G. Amati;E. Munson;Ying‐tong Zhao;G. Karypis;Frank Wm. Tompa;Vassilis Plachouras;Ben He;Ethan V. Munson;Mary Laarsgard;D. Cook;M. Matera
  • 通讯作者:
    M. Matera
Flexible Data Cubes for Online Aggregation
用于在线聚合的灵活数据立方体
Obtaining New Insights for Biodiversity Conservation from Broad-Scale Citizen Science Data
从大规模公民科学数据中获取生物多样性保护的新见解
  • DOI:
    10.1038/npre.2009.3967.1
  • 发表时间:
    2009
  • 期刊:
  • 影响因子:
    0
  • 作者:
    S. Kelling;D. Fink;W. Hochachka;Marshall J. Iliff;Brian L. Sullivan;Christopher Wood;Art Munson;Mirek Riedewald
  • 通讯作者:
    Mirek Riedewald

Mirek Riedewald的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Mirek Riedewald', 18)}}的其他基金

III: Small: A Scalable Search Tool for Interesting Patterns in Scientific Data
III:Small:科学数据中有趣模式的可扩展搜索工具
  • 批准号:
    1017793
  • 财政年份:
    2010
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Continuing Grant
SGER: Finding Interesting Patterns through Analysis of Complex Prediction Models
SGER:通过分析复杂的预测模型寻找有趣的模式
  • 批准号:
    0748626
  • 财政年份:
    2007
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Standard Grant

相似海外基金

Finding Australia’s Disabled Authors: Connection, Creativity, Community
寻找澳大利亚的残疾人作家:联系、创造力、社区
  • 批准号:
    DP240103154
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Discovery Projects
Mixed Quantum-Classical Semiclassical Theory: Finding Reaction Paths in Open Quantum Systems
混合量子经典半经典理论:寻找开放量子系统中的反应路径
  • 批准号:
    2404809
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Standard Grant
精神疾患患者の家族のbenefit findingの促進:国際共同研究によるプログラム開発とRCT
促进精神疾病患者家属的福利发现:通过国际合作研究进行项目开发和随机对照试验
  • 批准号:
    23K27886
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
Benefit-Findingに着目したAYA世代がんサバイバーサポートプログラムの構築
为 AYA 癌症幸存者建立一个支持计划,重点关注利益发现
  • 批准号:
    24K13741
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
Finding the targets of natural products in complex botanical extracts.
寻找复杂植物提取物中天然产物的靶标。
  • 批准号:
    LP230100225
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Linkage Projects
Finding equivalence between natural and artificial intelligences
寻找自然智能和人工智能之间的等价性
  • 批准号:
    DP240100400
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Discovery Projects
Finding a second Earth through stellar understanding
通过对恒星的了解寻找第二个地球
  • 批准号:
    MR/X033244/1
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Fellowship
A Phase 1 Dose Finding Study Of Intraocular Mitomycin-C Adjunct In Vitrectomy For Retinal Detachment And Proliferative Vitreoretinopathy (MORPH-1)
眼内丝裂霉素 C 辅助治疗视网膜脱离和增殖性玻璃体视网膜病变 (MORPH-1) 玻璃体切除术的 1 期剂量探索研究
  • 批准号:
    MR/Y008626/1
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Research Grant
CHECKPOINT: Finding immune & metabolic pathways to SMI
检查点:寻找免疫力
  • 批准号:
    MR/Z50354X/1
  • 财政年份:
    2024
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Research Grant
Fact-finding survey of nursing diagnoses, nursing outcomes, and nursing interventions in medical institution and edcational institution under COVID-19 pandemic
COVID-19大流行背景下医疗机构和教育机构护理诊断、护理结果和护理干预的实况调查
  • 批准号:
    23K09822
  • 财政年份:
    2023
  • 资助金额:
    $ 5.6万
  • 项目类别:
    Grant-in-Aid for Scientific Research (C)
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了