III: Small: RIOT: Statistical Computing with Efficient, Transparent I/O
III:小型:RIOT:具有高效、透明 I/O 的统计计算
基本信息
- 批准号:0916027
- 负责人:
- 金额:$ 50万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2009
- 资助国家:美国
- 起止时间:2009-09-01 至 2014-08-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
Recent technological advances enable collection of massive amounts ofdata in science, commerce, and society. These datasets bring uscloser than ever before to solving important problems such as decodinghuman genomes and coping with climate changes. Meanwhile, theexponential growth in data volume creates an urgent challenge. Manyexisting analysis tools assume datasets fit in memory; when applied tomassive datasets, they become unacceptably slow because of excessivedisk input/output (I/O) operations.Across application domains, much of advanced data analysis is donewith custom programming by statisticians. Progress has been hinderedby the lack of easy-to-use statistical computing environments thatsupport I/O-efficient processing of large datasets. There have beenmany approaches toward I/O-efficiency, but none has gained tractionwith statisticians because of issues ranging from efficiency tousability. Disk-based storage engines and I/O-efficient functionlibraries are only a partial solution, because many sources ofI/O-inefficiency in programs remain at a higher, inter-operationlevel. Database systems seem to be a natural solution, with efficientI/O and a declarative language (SQL) enabling high-leveloptimizations. However, much work in integrating databases andstatistical computing remains database-centric, forcing statisticiansto learn unfamiliar languages and deal with their impedance mismatchwith host languages.To make a practical impact on statistical computing, this projectpostulates that a better approach is to make it transparent to usershow I/O-efficiency is achieved. Transparency means no SQL, or any newlanguage to learn. Transparency means that existing code should runwithout modification, and automatically gain I/O-efficiency. Theproject, nicknamed RIOT, aims at extending R---a widely popularopen-source statistical computing environment---to transparentlyprovide efficient I/O. Achieving transparency is challenging; RIOTdoes so with an end-to-end solution addressing issues on all fronts:I/O-efficient algorithms, pipelined execution, deferred evaluation,I/O-cost-driven expression optimization, smart storage andmaterialization, and seamless integration with an interpreted hostlanguage.RIOT integrates research and education, and continues the tradition ofinvolving undergraduates through REU and independent studies. As adatabase researcher, the PI is committed to learning and drawing fromwork from programming languages and high-performance computing.Findings from RIOT help create synergy and seed further collaborationwith these communities. To ensure practical impact on statisticalcomputing, RIOT has enlisted collaboration from statisticians and theR core development team on developing, evaluating, and disseminatingRIOT.Further information can be found at: http://www.cs.duke.edu/dbgroup/Main/RIOT
最近的技术进步使收集科学、商业和社会中的大量数据成为可能。这些数据集使我们比以往任何时候都更接近于解决诸如破译人类基因组和应对气候变化等重要问题。与此同时,数据量的指数增长带来了一个紧迫的挑战。许多现有的分析工具都假设数据集适合内存;当应用于海量数据集时,由于过多的磁盘输入/输出(I/O)操作,它们变得不可接受地缓慢。由于缺乏易于使用的统计计算环境来支持大数据集的I/O效率处理,这一进展受到了阻碍。关于I/O效率的方法有很多种,但由于从效率到可调性等一系列问题,没有一种方法受到统计学家的重视。基于磁盘的存储引擎和I/O效率高的函数库只是部分解决方案,因为程序中I/O效率低下的许多来源仍然处于更高的互操作级别。数据库系统似乎是一种自然的解决方案,它具有高效的I/O和支持高级开发的声明性语言(SQL)。然而,在数据库和统计计算的集成方面,许多工作仍然以数据库为中心,迫使统计学家学习不熟悉的语言,并处理它们与宿主语言的阻抗不匹配。为了对统计计算产生实际影响,该项目假设更好的方法是使其对用户透明,从而实现I/O效率。透明意味着没有SQL,也没有任何需要学习的新语言。透明性意味着现有代码无需修改即可运行,并自动获得I/O效率。该项目绰号RIOT,旨在扩展R-一个广受欢迎的开源统计计算环境-以透明地提供高效的I/O。实现透明度具有挑战性;RIOT通过端到端的解决方案解决所有方面的问题:I/O高效算法、流水线执行、延迟计算、I/O成本驱动的表达式优化、智能存储和物化,以及与解释宿主语言的无缝集成。RIOT整合了研究和教育,并延续了通过REU和独立研究培养本科生的传统。作为数据库研究人员,PI致力于从编程语言和高性能计算中学习和借鉴。Riot的发现有助于创造协同效应,并促进与这些社区的进一步合作。为了确保对统计计算的实际影响,RIOT已经征集了统计学家和核心开发团队的合作,以开发、评估和传播RIOT。有关更多信息,请访问:http://www.cs.duke.edu/dbgroup/Main/RIOT
项目成果
期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
数据更新时间:{{ journalArticles.updateTime }}
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Jun Yang其他文献
High-efficiency, stable and non-chemical-doped graphene-Si solar cells through interface engineering and PMMA antireflection
通过界面工程和 PMMA 减反射实现高效、稳定、非化学掺杂的石墨烯-硅太阳能电池
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:3.9
- 作者:
Tianpeng Jiao;Dapeng Wei;Xuefen Song;Tai Sun;Jun Yang;Leyong Yu;Yanhui Feng;Wentao Sun;Wei Wei;Haofei Shi;Chenguo Hu;Chunlei Du - 通讯作者:
Chunlei Du
span style=font-family:#39;Times New Roman#39;;font-size:12pt;Dual sensitive and temporally controlled camptothecin prodrug liposomes codelivery of siRNA for high efficiency tumor therapy/span
双敏感和时间控制的喜树碱前药脂质体共递送 siRNA 用于高效肿瘤治疗
- DOI:
- 发表时间:
2014 - 期刊:
- 影响因子:14
- 作者:
Yan Li;Rui-Yuan Liu;Jun Yang;Guang-Hui Ma;Zhen-Zhong Zhang;Xin Zhang - 通讯作者:
Xin Zhang
Sorption behavior of perfluorooctane sulfonate on hydrous ferric oxide from aqueous solution
全氟辛烷磺酸对水溶液中水合三氧化二铁的吸附行为
- DOI:
10.5004/dwt.2021.27270 - 发表时间:
2021 - 期刊:
- 影响因子:1.1
- 作者:
Ji Zang;Tiantian Wu;Jun Yang;Zhengxin Xie;Shisuo Fan;Jun Tang - 通讯作者:
Jun Tang
Study on the Influencing Factors of Short-Term Recovery of Neurological Symptoms after Carotid Body Tumor Resection
颈动脉体肿瘤切除术后神经症状短期恢复的影响因素研究
- DOI:
10.1007/s00268-023-07068-4 - 发表时间:
2023 - 期刊:
- 影响因子:2.6
- 作者:
Wanzhong Yuan;R. Huo;Chaofan Hou;Zhongzheng Wang;Jun Yang;Tao Wang - 通讯作者:
Tao Wang
New ouabain-conjugated peptide found from phage displayed peptide library.
从噬菌体展示肽库中发现新的哇巴因缀合肽。
- DOI:
10.1016/j.amjhyper.2004.03.669 - 发表时间:
2004 - 期刊:
- 影响因子:3.2
- 作者:
Ming;Jun Yang;Zhuo - 通讯作者:
Zhuo
Jun Yang的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Jun Yang', 18)}}的其他基金
Modulator-free Performance-Oriented Control (MfPOC) for Direct Electric Drives
用于直接电力驱动的无调制器性能导向控制 (MfPOC)
- 批准号:
EP/W027283/1 - 财政年份:2023
- 资助金额:
$ 50万 - 项目类别:
Research Grant
III: Small: Helping Novices Learn and Debug Relational Queries
三:小:帮助新手学习和调试关系查询
- 批准号:
2008107 - 财政年份:2020
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
III: Small: Durability Queries in Databases
III:小:数据库中的持久性查询
- 批准号:
1814493 - 财政年份:2018
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SPX: Enabling Scalable Synchronizations for General Purpose GPUs
SPX:为通用 GPU 启用可扩展同步
- 批准号:
1725657 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SHF: Small: Approximate-Computing Enabled Robust 3D NAND Flash Memories
SHF:小型:支持近似计算的稳健 3D NAND 闪存
- 批准号:
1718080 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: Collaborative Research: Towards End-to-End Computer-Assisted Fact-Checking
III:小型:协作研究:走向端到端计算机辅助事实核查
- 批准号:
1718398 - 财政年份:2017
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
SHF: Small: Architectural Support for Reliable ReRAM Crossbar Memory
SHF:小型:对可靠 ReRAM 交叉开关内存的架构支持
- 批准号:
1617071 - 财政年份:2016
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Small: DBMS+: Management System for the Next-Generation Database
III:小型:DBMS:下一代数据库管理系统
- 批准号:
1423124 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
III: Medium: Collaborative Research: From Answering Questions to Questioning Answers (and Questions)---Perturbation Analysis of Database Queries
III:媒介:协作研究:从回答问题到质疑答案(和问题)——数据库查询的扰动分析
- 批准号:
1408846 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Continuing Grant
SHF: Small: A Brick in the Wall: Achieving Yield, Performance and Density Effective DRAM Beyond 22nm Technology
SHF:小型:墙上的砖:实现超越 22 纳米技术的良率、性能和密度有效 DRAM
- 批准号:
1422331 - 财政年份:2014
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
相似国自然基金
昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
- 批准号:
- 批准年份:2024
- 资助金额:0.0 万元
- 项目类别:省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
- 批准号:n/a
- 批准年份:2022
- 资助金额:10.0 万元
- 项目类别:省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
- 批准号:32000033
- 批准年份:2020
- 资助金额:24.0 万元
- 项目类别:青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
- 批准号:31972324
- 批准年份:2019
- 资助金额:58.0 万元
- 项目类别:面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
- 批准号:81900988
- 批准年份:2019
- 资助金额:21.0 万元
- 项目类别:青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
- 批准号:31870821
- 批准年份:2018
- 资助金额:56.0 万元
- 项目类别:面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
- 批准号:31802058
- 批准年份:2018
- 资助金额:26.0 万元
- 项目类别:青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
- 批准号:31772128
- 批准年份:2017
- 资助金额:60.0 万元
- 项目类别:面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
- 批准号:81704176
- 批准年份:2017
- 资助金额:20.0 万元
- 项目类别:青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
- 批准号:91640114
- 批准年份:2016
- 资助金额:85.0 万元
- 项目类别:重大研究计划
相似海外基金
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
- 批准号:
2312089 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS: Small: NSF-DST: Modernizing Underground Mining Operations with Millimeter-Wave Imaging and Networking
NeTS:小型:NSF-DST:利用毫米波成像和网络实现地下采矿作业现代化
- 批准号:
2342833 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
CPS: Small: NSF-DST: Autonomous Operations of Multi-UAV Uncrewed Aerial Systems using Onboard Sensing to Monitor and Track Natural Disaster Events
CPS:小型:NSF-DST:使用机载传感监测和跟踪自然灾害事件的多无人机无人航空系统自主操作
- 批准号:
2343062 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Reservoir Computing with Ion-Channel-Based Memristors
合作研究:FET:小型:基于离子通道忆阻器的储层计算
- 批准号:
2403559 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
オミックス解析を用いたブドウ球菌 small colony variants の包括的特徴づけ
使用组学分析全面表征葡萄球菌小菌落变体
- 批准号:
24K13443 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
- 批准号:
2332922 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
- 批准号:
2329908 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
- 批准号:
2331111 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331302 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
- 批准号:
2331301 - 财政年份:2024
- 资助金额:
$ 50万 - 项目类别:
Standard Grant