HECURA: Colaborative: Multidimensional and String Indexes for Streaming Data
HECURA:协作:流数据的多维和字符串索引
基本信息
- 批准号:0937860
- 负责人:
- 金额:$ 60万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2013-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
This research project aims to understand and develop systems formaintaining superlinear indexes for streaming data. A superlinearindex provides search capability over an abstract space that cannoteasily be linearized (totally ordered). In contrast, a linear index,typified by a B-tree, supports point and range queries on totallyordered data.Examples of superlinear indexes include multidimensional indexes,which can be over a geometric domain, such as geographic data, orwhich can be over multiple linear indexes; and full text queries,which can include searching for a particular word or substring.The superlinear indexes found in today's databases cannot support highrates of insertion. On traditional mechanical disk drives, theexisting superlinear indexes can only support about one hundredinsertions per second in the worst case. For many importantapplications, that is too slow, and so database users often avoidsuperlinear indexing. Even traditional linear indexes based onB-trees cannot support the high insertion rates demanded by manydatabases.This research investigates streaming superlinear indexes, that is,indexes that efficiently support full text or multidimensionalqueries, and can be updated at speeds that are related to diskbandwidth rather than seeks per second.Among the significant research issues are the following: (1) designefficient files structures for streaming superlinear indexes; (2)investigate how streaming superlinear indexes might pave the way toimproved file systems; (3) determine whether cache-obliviousalgorithms technology can enhance streaming superlinear indexes; and(4) program complex data structures for transactions and recovery.If successful, this research will show how to build filesystems thatachieve dramatically better performance than today's B-tree-basedfilesystems, how to maintain rich geometrical data andmultidimensional nongeographical databases in real time, and how tomaintain full-text searchable databases in real time. For example,some of today's file systems try to maintain an full-text index tofind strings in files quickly, but these systems often fall behind athigh data write rates. A streaming superlinear index would allow sucha file system to keep up, and would improve the usability of bothhigh-end storage systems and relatively small consumer storage systemsthat are nonetheless too large to index with today's indexes.The researchers are developing course materials on streaming indexingtechnology which will be made freely available under the MITOpenCourseWare initiative (http://ocw.mit.edu).Further information on this project may be found at the projectweb page: http://supertech.csail.mit.edu/superlinear-indexes
这个研究项目的目的是了解和开发系统为维护超线性索引的流数据。 一个超线性索引提供了在一个抽象空间上的搜索能力,这个抽象空间不容易被线性化(全序)。相比之下,以B树为代表的线性索引支持对全有序数据的点和范围查询。超线性索引的示例包括多维索引,它可以在几何域(如地理数据)上,也可以在多个线性索引上;以及全文查询,它可以包括搜索特定的单词或子字符串。当今数据库中的超线性索引不能支持高插入率。 在传统的机械磁盘驱动器上,现有的超线性索引在最坏的情况下只能支持大约每秒100次插入。 对于许多重要的应用程序来说,这太慢了,所以数据库用户经常避免超线性索引。 即使是传统的基于B树的线性索引也不能满足很多数据库对高插入率的要求,本文研究了流超线性索引,即能有效支持全文或多维查询的索引,其更新速度与磁盘带宽有关,而不是与每秒的寻道次数有关,主要研究内容如下:(1)设计高效的流超线性索引文件结构;(2)研究流式超线性索引如何为改进文件系统铺平道路;(3)确定缓存无关算法技术是否可以增强流式超线性索引;以及(4)为事务和恢复编写复杂的数据结构。如果成功的话,这项研究将展示如何构建比今天基于B树的文件系统具有更好性能的文件系统,如何真实的实时维护丰富的几何数据和多维非地理数据库,以及如何真实的实时维护全文检索数据库。 例如,今天的一些文件系统试图维护一个全文索引来快速查找文件中的字符串,但这些系统往往落后于高数据写入速率。 流超线性索引将允许苏查这样的文件系统跟上,并将提高高端存储系统和相对较小的消费者存储系统的可用性,这些系统太大而无法用今天的索引进行索引。研究人员正在开发关于流索引技术的课程材料,这些材料将在麻省理工学院开放式课程计划(http://www.example.com)下免费提供。关于该项目的更多信息可以在项目网站页面上找到:ocw.mit.edu http://supertech.csail.mit.edu/superlinear-indexes
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Charles Leiserson其他文献
Charles Leiserson的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Charles Leiserson', 18)}}的其他基金
POSE: Phase I: Open Source Ecosystem for OpenCilk
POSE:第一阶段:OpenCilk 开源生态系统
- 批准号:
2229704 - 财政年份:2022
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
CCRI: Medium: Cilk Infrastructure for Next-Generation Parallel-Programming Research
CCRI:Medium:用于下一代并行编程研究的 Cilk 基础设施
- 批准号:
1925609 - 财政年份:2019
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
XPS: FULL: FP: A profile-centric IDE for science-based performance engineering in the cloud
XPS:FULL:FP:以配置文件为中心的 IDE,用于云中基于科学的性能工程
- 批准号:
1533644 - 财政年份:2015
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
SHF: AF: Large: Collaborative Research: Parallelism without Concurrency
SHF:AF:大型:协作研究:无并发的并行性
- 批准号:
1314547 - 财政年份:2013
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
SHF: AF: Medium: Collaborative Research:The Ponchoir Stencil Complier
SHF:AF:媒介:协作研究:Ponchoir Stencil Complier
- 批准号:
1162148 - 财政年份:2012
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
CSR: Small: Using Thread-Local Memory Mapping to Support Memory Abstractions for Dynamic Multithreading
CSR:小:使用线程本地内存映射支持动态多线程的内存抽象
- 批准号:
1017058 - 财政年份:2010
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
CSR-AES: Feedback-Driven Adaptive Multithreading
CSR-AES:反馈驱动的自适应多线程
- 批准号:
0615215 - 财政年份:2006
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
HECURA: Microdata Storage Systems for High-End Computing
HECURA:用于高端计算的微数据存储系统
- 批准号:
0621511 - 财政年份:2006
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
CPA: Practical Cache-Oblivious B-Trees
CPA:实用的忽略缓存的 B 树
- 批准号:
0541209 - 财政年份:2006
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
相似海外基金
Acquisition of Colaborative Robot System for Ultrasound Research
采购用于超声研究的协作机器人系统
- 批准号:
10798904 - 财政年份:2022
- 资助金额:
$ 60万 - 项目类别:
Colaborative Research: Influence of wind and bottom generated turbulence on air-sea gas exchange in shallow water environments
合作研究:风和底部产生的湍流对浅水环境中海气交换的影响
- 批准号:
1829657 - 财政年份:2018
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Online phramaceutical database and colaborative platform
在线药物数据库和协作平台
- 批准号:
752103 - 财政年份:2015
- 资助金额:
$ 60万 - 项目类别:
Vouchers
Colaborative: Design of Accelerated Prognostics and Health Management
协作:加速预测和健康管理的设计
- 批准号:
1127922 - 财政年份:2011
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
HECURA: Colaborative: Multidimensional and String Indexes for Streaming Data
HECURA:协作:流数据的多维和字符串索引
- 批准号:
0937822 - 财政年份:2009
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
HECURA: Colaborative: Multidimensional and String Indexes for Streaming Data
HECURA:协作:流数据的多维和字符串索引
- 批准号:
0937829 - 财政年份:2009
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
Colaborative Research: Open Access Amplitude Analysis on a Grid
合作研究:网格上的开放接入幅度分析
- 批准号:
0653316 - 财政年份:2007
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
Colaborative Research SST: Integration of Spectroscopic Sensors and Electroactive Nanowell Arrays with Microfluidic Chips Based on Thermocapillary Actuation
合作研究SST:光谱传感器和电活性纳米井阵列与基于热毛细管驱动的微流控芯片的集成
- 批准号:
0529045 - 财政年份:2005
- 资助金额:
$ 60万 - 项目类别:
Standard Grant
COLABORATIVE RESEARCH: Closure of Thermodynamically Constrained Models for Multiphase Systems
合作研究:多相系统热力学约束模型的闭合
- 批准号:
9901660 - 财政年份:1999
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant
Colaborative Research: Accessing Brain Collection Informationand Images Via Internet, CD-Rom and Centralized Location
合作研究:通过互联网、CD-ROM 和集中位置访问大脑采集信息和图像
- 批准号:
9814911 - 财政年份:1998
- 资助金额:
$ 60万 - 项目类别:
Continuing Grant