SGER: An Online Repository of Large Data Sets for Data Mining Research and Experimentation

SGER:用于数据挖掘研究和实验的大型数据集在线存储库

基本信息

  • 批准号:
    9813584
  • 负责人:
  • 金额:
    $ 9.97万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    1998
  • 资助国家:
    美国
  • 起止时间:
    1998-08-15 至 2001-01-31
  • 项目状态:
    已结题

项目摘要

Over the last two decades there has been an explosive growth in online data storage of various forms. These large datasets have motivated the rapid development of data mining methods. However, until now, there has been a lack of an online repository of large data sets for researchers to evaluate and compare their methods. In this project, an online repository of large and difficult data sets are being gathered that are representative of the diverse character of many important scientific and business domains. This repository includes high-dimensional data sets as well as data sets of different data types (time series, spatial data, transaction data, and so forth). The primary role of the repository is that of a benchmark testbed to enable researchers in data mining (including computer scientists, statisticians, engineers, and mathematicians) to scale existing and future data analysis algorithms to very large data sets. Each data set in the respository contains online documentation, metadata, and links to relevant background domain information such as prior published work. Availability of a standard set of large benchmark data sets will directly stimulate and foster systematic progress in data mining related research, similar to the affect that the UCI Machine Learning Data Repository has had on machine learning research. This repository will play a substantial role in brokering the gap between research-oriented algorithm development in the laboratory and the real-world practicalities and challenges of very large data sets. http://www.ics.uci.edu/~mlearn/MLRepository.html
在过去的二十年里,各种形式的在线数据存储出现了爆炸性增长。这些大型数据集促进了数据挖掘方法的快速发展。然而,到目前为止,一直缺乏一个大型数据集的在线存储库,供研究人员评估和比较他们的方法。在这个项目中,正在收集一个大型和困难的数据集的在线储存库,这些数据集代表了许多重要科学和商业领域的不同特点。该存储库包括高维数据集以及不同数据类型的数据集(时间序列、空间数据、事务数据等)。存储库的主要作用是基准测试平台,使数据挖掘研究人员(包括计算机科学家,统计学家,工程师和数学家)能够将现有和未来的数据分析算法扩展到非常大的数据集。资源库中的每个数据集都包含在线文档、元数据和相关背景领域信息的链接,如以前发表的作品。一组标准的大型基准数据集的可用性将直接刺激和促进数据挖掘相关研究的系统性进展,类似于UCI机器学习数据库对机器学习研究的影响。这个知识库将在填补实验室中面向研究的算法开发与现实世界的实用性和超大数据集的挑战之间的差距方面发挥重要作用。 http://www.ics.uci.edu/~mlearn/MLRepository.html

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Padhraic Smyth其他文献

Recursive Neural Networks for Coding Therapist and Patient Behavior in Motivational Interviewing
用于编码动机访谈中治疗师和患者行为的递归神经网络
  • DOI:
  • 发表时间:
    2015
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Michael J. Tanana;Kevin A. Hallgren;Zac E. Imel;David C. Atkins;Padhraic Smyth;Vivek Srikumar
  • 通讯作者:
    Vivek Srikumar
Probabilistic Model-Based Clustering of Multivariate and Sequential Data
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Padhraic Smyth
  • 通讯作者:
    Padhraic Smyth
The Distribution of Cycle Lengths in Graphical Models for Iterative Decoding
迭代解码图形模型中循环长度的分布
  • DOI:
  • 发表时间:
    1999
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Xianping Ge;D. Eppstein;Padhraic Smyth
  • 通讯作者:
    Padhraic Smyth
Statistical Methods for the Forensic Analysis of Geolocated Event Data
  • DOI:
    10.1016/j.fsidi.2020.301009
  • 发表时间:
    2020-07-01
  • 期刊:
  • 影响因子:
  • 作者:
    Christopher Galbraith;Padhraic Smyth;Hal S. Stern
  • 通讯作者:
    Hal S. Stern
Pattern discovery in sequences under a Markov assumption
马尔可夫假设下的序列模式发现

Padhraic Smyth的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Padhraic Smyth', 18)}}的其他基金

RI: Medium: Assessment of Machine Learning Algorithms in the Wild
RI:媒介:机器学习算法的实际评估
  • 批准号:
    1900644
  • 财政年份:
    2019
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
NRT-DESE: Team Science for Integrative Graduate Training in Data Science and Physical Science
NRT-DESE:数据科学和物理科学研究生综合培训的团队科学
  • 批准号:
    1633631
  • 财政年份:
    2016
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
III: Small: Statistical Learning Algorithms for Micro-Event Time Series Data
三:小:微事件时间序列数据的统计学习算法
  • 批准号:
    1320527
  • 财政年份:
    2013
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Continuing Grant
Collaborative Research: Balancing the Portfolio: Efficiency and Productivity of Federal Biomedical R&D Funding
合作研究:平衡投资组合:联邦生物医学研究的效率和生产力
  • 批准号:
    1158699
  • 财政年份:
    2012
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
CRI: Collaborative Research: Improving Experimental Computer Science with a Searchable Web Portal for Datasets
CRI:协作研究:通过可搜索的数据集门户网站改进实验计算机科学
  • 批准号:
    0551510
  • 财政年份:
    2006
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Continuing Grant
Statistical Data Mining of Time-Dependent Data with Applications in Geoscience and Biology
时变数据的统计数据挖掘及其在地球科学和生物学中的应用
  • 批准号:
    0431085
  • 财政年份:
    2004
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
Data Mining of Digital Behaviour
数字行为的数据挖掘
  • 批准号:
    0083489
  • 财政年份:
    2001
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Continuing Grant
CAREER: Probabilistic Knowledge Discovery and Data Mining: An Integrated Approach at the Interface of ComputerScience and Statistics
职业:概率知识发现和数据挖掘:计算机科学和统计学接口的综合方法
  • 批准号:
    9703120
  • 财政年份:
    1997
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Continuing Grant

相似国自然基金

Scalable Learning and Optimization: High-dimensional Models and Online Decision-Making Strategies for Big Data Analysis
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    合作创新研究团队
Data-driven Recommendation System Construction of an Online Medical Platform Based on the Fusion of Information
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    万元
  • 项目类别:
    外国青年学者研究基金项目
online SPE/HPLC-ICP-MS多元素形态分析新方法研究荷塘中铬砷镉汞铅的迁移转化规律
  • 批准号:
    21976048
  • 批准年份:
    2019
  • 资助金额:
    65.0 万元
  • 项目类别:
    面上项目
双积分政策下基于Online Review的新能源汽车企业跨链决策优化研究
  • 批准号:
    71964023
  • 批准年份:
    2019
  • 资助金额:
    27.5 万元
  • 项目类别:
    地区科学基金项目
面向Online-to-Offline智能商务的大数据融合与应用
  • 批准号:
    91646204
  • 批准年份:
    2016
  • 资助金额:
    201.0 万元
  • 项目类别:
    重大研究计划
Online-to-Offline商务环境下"切客"一族生活模式挖掘研究
  • 批准号:
    71172046
  • 批准年份:
    2011
  • 资助金额:
    41.0 万元
  • 项目类别:
    面上项目

相似海外基金

AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
Collaborative Research: HNDS-I: NewsScribe - Extending and Enhancing the Media Cloud Searchable Global Online News Archive
合作研究:HNDS-I:NewsScribe - 扩展和增强媒体云可搜索全球在线新闻档案
  • 批准号:
    2341858
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
Collaborative Research: HNDS-I: NewsScribe - Extending and Enhancing the Media Cloud Searchable Global Online News Archive
合作研究:HNDS-I:NewsScribe - 扩展和增强媒体云可搜索全球在线新闻档案
  • 批准号:
    2341859
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Standard Grant
Personalized Online Adaptive Learning System
个性化在线自适应学习系统
  • 批准号:
    23K20186
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Grant-in-Aid for Scientific Research (B)
DMS-EPSRC: Asymptotic Analysis of Online Training Algorithms in Machine Learning: Recurrent, Graphical, and Deep Neural Networks
DMS-EPSRC:机器学习中在线训练算法的渐近分析:循环、图形和深度神经网络
  • 批准号:
    EP/Y029089/1
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Research Grant
Facilitating circular construction practices in the UK: A data driven online marketplace for waste building materials
促进英国的循环建筑实践:数据驱动的废弃建筑材料在线市场
  • 批准号:
    10113920
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    SME Support
The Information-Attention Tradeoff: Toward an Understanding of the Fundamentals of Online Attention
信息与注意力的权衡:了解在线注意力的基本原理
  • 批准号:
    2343858
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Continuing Grant
High Quality-of-Experience Real-time Video for Smart Online Shopping
智能在线购物的高质量体验实时视频
  • 批准号:
    LP230100294
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Linkage Projects
Improving Legal Frameworks to Support Online Child Sex Abuse Prosecutions
完善法律框架以支持在线儿童性虐待起诉
  • 批准号:
    DP240101649
  • 财政年份:
    2024
  • 资助金额:
    $ 9.97万
  • 项目类别:
    Discovery Projects
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了