CAREER: Algorithmic Techniques for Massive Data Sets

职业:海量数据集的算法技术

基本信息

  • 批准号:
    0093400
  • 负责人:
  • 金额:
    $ 30.49万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Continuing grant
  • 财政年份:
    2001
  • 资助国家:
    美国
  • 起止时间:
    2001-07-01 至 2006-06-30
  • 项目状态:
    已结题

项目摘要

A number of new applications have recently emerged that require the storage,maintenance, and analysis of massive amounts of data. Examples such as websearch engines, data warehouses, and large scientific data repositories often involve multiple terabytes of data that are simultaneously searched and explored by many users. This research project investigates fundamental algorithmic problems arising in the context of such large data sets, studies the complexity of these problems, develops new techniques for their efficient solution, and experimentally validates proposed techniques in the appropriate system and application context. The main focus is on problems arising in databases and in searching and analyzing the World-Wide Web.More precisely, the research focuses on problems concerning the storage, maintenance, partitioning, indexing, and approximate representation of very large data sets, and the efficient exploration, analysis and precise and approximate querying of such data. The types of problems that are studied canbe grouped into two categories, one consisting of problems motivated mainly by applications in the database area, and one motivated by applications in web search and analysis. In the first category, the project studies multi-dimensional data partitioning problems arising in selectivity estimationand indexing, feedback-based approaches to selectivity estimation, associationrule mining problems, and the approximate and precise evaluation of complexqueries on large data sets. The problems studied in the second category areconcerned with online search on the web, the study of random graph models forthe web, and efficient computing with large web graphs and hypertext collections.
最近出现了许多需要存储、维护和分析大量数据的新应用程序。网络搜索引擎、数据仓库和大型科学数据存储库等示例通常涉及多个用户同时搜索和探索的多TB数据。该研究项目调查在这样的大数据集的背景下产生的基本算法问题,研究这些问题的复杂性,开发新的技术来有效地解决这些问题,并在适当的系统和应用环境中实验验证所提出的技术。主要关注数据库和万维网搜索分析中出现的问题,更准确地说,研究的重点是关于存储,维护,分区,索引和近似表示非常大的数据集的问题,以及有效的探索,分析和精确和近似查询这样的数据。研究的问题类型可以分为两类,一类是主要由数据库领域的应用程序驱动的问题,另一类是由Web搜索和分析中的应用程序驱动的问题。在第一类中,该项目研究多维数据划分问题中出现的选择性估计和索引,反馈为基础的方法来估计选择性,关联规则挖掘问题,以及近似和精确的评估复杂的查询大数据集。第二类研究的问题涉及网络上的在线搜索,网络随机图模型的研究,以及大型网络图和超文本集合的有效计算。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Torsten Suel其他文献

Permutation Routing and Sorting on Meshes with Row and Column Buses
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Torsten Suel
  • 通讯作者:
    Torsten Suel
On Randomized and Deterministic Schemes for Routing and Sorting on Fixed-Connection Networks
  • DOI:
    10.1007/3-540-64359-1_711
  • 发表时间:
    1998-03
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Torsten Suel
  • 通讯作者:
    Torsten Suel
Towards an Open and Highly Distributed Web Information Retrieval Architecture
走向开放和高度分布式的Web信息检索架构
  • DOI:
  • 发表时间:
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Torsten Suel;Chandana Mathur;Jo;Jiangong Zhang;A. Delis;M. Kharrazi;Xiaohui Long;K. Shanmugasundaram
  • 通讯作者:
    K. Shanmugasundaram
Approximate maximum weight branchings
近似最大重量分支
  • DOI:
  • 发表时间:
    2006
  • 期刊:
  • 影响因子:
    0.5
  • 作者:
    A. Bagchi;A. Bhargava;Torsten Suel
  • 通讯作者:
    Torsten Suel
Lower Bounds for Shellsort
希尔排序的下界
  • DOI:
    10.1006/jagm.1996.0825
  • 发表时间:
    1997
  • 期刊:
  • 影响因子:
    0
  • 作者:
    Greg Plaxton;Torsten Suel;Greg Plaxton
  • 通讯作者:
    Greg Plaxton

Torsten Suel的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Torsten Suel', 18)}}的其他基金

III: Small: Index Sharding and Query Routing in Distributed Search Engines
III:小:分布式搜索引擎中的索引分片和查询路由
  • 批准号:
    1718680
  • 财政年份:
    2017
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Continuing Grant
III: Small: Efficient Query Processing in Large Search Engines
III:小型:大型搜索引擎中的高效查询处理
  • 批准号:
    1117829
  • 财政年份:
    2011
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Standard Grant

相似海外基金

Indexing Massive Datasets with Algorithmic Engineered Compression Techniques on Modern Computer Architectures
在现代计算机架构上使用算法工程压缩技术索引海量数据集
  • 批准号:
    21K17701
  • 财政年份:
    2021
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Grant-in-Aid for Early-Career Scientists
AF: Medium: Theory of Computation - New Algorithmic and Hardness Techniques
AF:媒介:计算理论 - 新算法和硬度技术
  • 批准号:
    1900460
  • 财政年份:
    2019
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Continuing Grant
Linear Algebraic Techniques in Algorithmic Graph Theory
算法图论中的线性代数技术
  • 批准号:
    RGPIN-2015-04318
  • 财政年份:
    2019
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Discovery Grants Program - Individual
AF: Small: Algorithmic Techniques for High-throughput Analysis of Long Reads
AF:小:长读长高通量分析的算法技术
  • 批准号:
    1816027
  • 财政年份:
    2018
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Standard Grant
Algorithmic Democratic Engagement: Automating decision analytic techniques in a social media context to achieve deliberative democracy and responsive governance
算法民主参与:在社交媒体环境中自动化决策分析技术,以实现协商民主和响应式治理
  • 批准号:
    530878-2018
  • 财政年份:
    2018
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Engage Grants Program
Linear Algebraic Techniques in Algorithmic Graph Theory
算法图论中的线性代数技术
  • 批准号:
    RGPIN-2015-04318
  • 财政年份:
    2018
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Discovery Grants Program - Individual
CPS: Small: Novel Algorithmic Techniques for Drone Flight Planning on a Large Scale
CPS:小型:大规模无人机飞行规划的新颖算法技术
  • 批准号:
    1837779
  • 财政年份:
    2018
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Standard Grant
Linear Algebraic Techniques in Algorithmic Graph Theory
算法图论中的线性代数技术
  • 批准号:
    477857-2015
  • 财政年份:
    2017
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Discovery Grants Program - Accelerator Supplements
Linear Algebraic Techniques in Algorithmic Graph Theory
算法图论中的线性代数技术
  • 批准号:
    RGPIN-2015-04318
  • 财政年份:
    2017
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Discovery Grants Program - Individual
Linear Algebraic Techniques in Algorithmic Graph Theory
算法图论中的线性代数技术
  • 批准号:
    RGPIN-2015-04318
  • 财政年份:
    2016
  • 资助金额:
    $ 30.49万
  • 项目类别:
    Discovery Grants Program - Individual
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了