CI-EN: Boa: Enhancing Infrastructure for Studying Software and its Evolution at a Large Scale
CI-EN:Boa:增强大规模研究软件及其演化的基础设施
基本信息
- 批准号:1513263
- 负责人:
- 金额:$ 142.69万
- 依托单位:
- 依托单位国家:美国
- 项目类别:Standard Grant
- 财政年份:2015
- 资助国家:美国
- 起止时间:2015-06-01 至 2021-05-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
In today's software-centric world, ultra-large-scale software repositories, e.g., SourceForge, GitHub, and Google Code, with hundreds of thousands of projects each, are the new library of Alexandria. They contain an enormous corpus of software and information about software and software projects. Scientists and engineers alike are interested in analyzing this wealth of information to test important research hypotheses. However, the current barrier to entry is prohibitive because deep expertise and sophisticated tools are needed to write programs that access version control systems, store and retrieve workable data subsets, and perform the needed ultra-large-scale analysis. The goal is accelerate the pace of Software Engineering research and to increase reusability and replicability, while properly curating the data and analyses. This project is building a CISE research infrastructure called Boa to aid and assist with such research and will be globally available. The project designs a new programming language that can hide the details of programmatically accessing version control systems, data storage and retrieval, data mining, and parallelization from the scientists and engineers and allow them to focus on the program logic. The project also designs a data mining infrastructure for Boa, and a BIGDATA repository containing 700,000+ open source projects for analyzing ultra-large-scale software repositories to help with such experiments. The broader impacts of Boa stem from its potential to enable developers, designers and researchers to build intuitive, multi-modal, user-centric, scientific applications that can aid and enable scientific research on individual, social, legal, policy, and technical aspects of open source software development. This advance will primarily be achieved by significantly lowering the barrier to entry and thus enabling a larger and more ambitious line of data-intensive scientific discovery in this area.
在当今以软件为中心的世界中,超大规模的软件存储库,例如SourceForge,Github和Google Code,每个项目都有成千上万的项目,是Alexandria的新图书馆。它们包含有关软件和软件项目的大量软件和信息。科学家和工程师都有兴趣分析这些丰富的信息以检验重要的研究假设。但是,目前的进入障碍是令人难以置信的,因为需要深厚的专业知识和复杂的工具来编写程序来访问版本控制系统,存储和检索可行的数据子集,并执行所需的超大规模分析。目标是加快软件工程研究的速度,并提高可重复性和可复制性,同时正确地策划数据和分析。该项目正在建立一个名为BOA的CISE研究基础设施,以帮助和协助此类研究,并将在全球范围内提供。该项目设计了一种新的编程语言,可以隐藏通过编程性访问版本控制系统,数据存储和检索,数据挖掘以及来自科学家和工程师并行化的详细信息,并允许他们专注于程序逻辑。该项目还设计了BOA的数据挖掘基础架构,以及一个包含700,000多个开源项目的BigData存储库,用于分析超大规模的软件存储库,以帮助进行此类实验。 BOA的更广泛影响源于其潜力使开发人员,设计师和研究人员能够建立直觉,多模式,以用户为中心的科学应用,这些应用程序可以帮助和实现开源软件开发的个人,社会,法律,政策和技术方面的科学研究。这一进步将主要通过显着降低进入障碍,从而实现这一领域的更大,更雄心勃勃的数据密集型科学发现线。
项目成果
期刊论文数量(7)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
On decomposing a deep neural network into modules
- DOI:10.1145/3368089.3409668
- 发表时间:2020-11
- 期刊:
- 影响因子:0
- 作者:Rangeet Pan;Hridesh Rajan
- 通讯作者:Rangeet Pan;Hridesh Rajan
A Comprehensive Study on Deep Learning Bug Characteristics
- DOI:10.1145/3338906.3338955
- 发表时间:2019-01-01
- 期刊:
- 影响因子:0
- 作者:Islam, Md Johirul;Nguyen, Giang;Rajan, Hridesh
- 通讯作者:Rajan, Hridesh
Repairing Deep Neural Networks: Fix Patterns and Challenges
- DOI:10.1145/3377811.3380378
- 发表时间:2020-05
- 期刊:
- 影响因子:0
- 作者:Md Johirul Islam;Rangeet Pan;Giang Nguyen;Hridesh Rajan
- 通讯作者:Md Johirul Islam;Rangeet Pan;Giang Nguyen;Hridesh Rajan
Fair Preprocessing: Towards Understanding Compositional Fairness of Data Transformers in Machine Learning Pipeline
- DOI:10.1145/3468264.3468536
- 发表时间:2021-01-01
- 期刊:
- 影响因子:0
- 作者:Biswas, Sumon;Rajan, Hridesh
- 通讯作者:Rajan, Hridesh
Do the Machine Learning Models on a Crowd Sourced Platform Exhibit Bias? An Empirical Study on Model Fairness
- DOI:10.1145/3368089.3409704
- 发表时间:2020-01-01
- 期刊:
- 影响因子:0
- 作者:Biswas, Sumon;Rajan, Hridesh
- 通讯作者:Rajan, Hridesh
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
Hridesh Rajan其他文献
A case for explicit join point models for aspect-oriented intermediate languages
面向方面中间语言的显式连接点模型的案例
- DOI:
10.1145/1230136.1230140 - 发表时间:
2007 - 期刊:
- 影响因子:0
- 作者:
Hridesh Rajan - 通讯作者:
Hridesh Rajan
Automating Cut-off for Multi-parameterized Systems
多参数化系统的自动切断
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
Youssef Hanna;David Samuelson;Samik Basu;Hridesh Rajan - 通讯作者:
Hridesh Rajan
Intensional Effect Polymorphism
内涵效应多态性
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Yuheng Long;Yu David Liu;Hridesh Rajan - 通讯作者:
Hridesh Rajan
Design, Semantics and Implementation of the Ptolemy Programming Language: A Language with Quantified Typed Events
托勒密编程语言的设计、语义和实现:一种具有量化类型事件的语言
- DOI:
- 发表时间:
2015 - 期刊:
- 影响因子:0
- 作者:
Hridesh Rajan;G. Leavens - 通讯作者:
G. Leavens
A Preliminary Study of Quantified , Typed Events
量化、类型化事件的初步研究
- DOI:
- 发表时间:
2010 - 期刊:
- 影响因子:0
- 作者:
Robert Dyer;M. Bagherzadeh;Hridesh Rajan;Yuanfang Cai - 通讯作者:
Yuanfang Cai
Hridesh Rajan的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('Hridesh Rajan', 18)}}的其他基金
SHF:Small: More Modular Deep Learning
SHF:Small:更加模块化的深度学习
- 批准号:
2223812 - 财政年份:2022
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
Collaborative Research: CCRI: ENS: Boa 2.0: Enhancing Infrastructure for Studying Software and its Evolution at a Large Scale
合作研究:CCRI:ENS:Boa 2.0:增强大规模研究软件及其演化的基础设施
- 批准号:
2120448 - 财政年份:2021
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
HDR TRIPODS: D4 (Dependable Data-Driven Discovery) Institute
HDR TRIPODS:D4(可靠数据驱动的发现)研究所
- 批准号:
1934884 - 财政年份:2019
- 资助金额:
$ 142.69万 - 项目类别:
Continuing Grant
Travel Grant to Attend Big Data in Software Engineering Track
参加软件工程大数据课程的旅费补助
- 批准号:
1743070 - 财政年份:2017
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
SHF: Large:Collaborative Research: Inferring Software Specifications from Open Source Repositories by Leveraging Data and Collective Community Expertise
SHF:大型:协作研究:利用数据和集体社区专业知识从开源存储库推断软件规范
- 批准号:
1518897 - 财政年份:2015
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
SHF: Small: Capsule-oriented Programming
SHF:小型:面向胶囊的编程
- 批准号:
1423370 - 财政年份:2014
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
EAGER: Boa: A Community Research Infrastructure for Mining Software Repositories
EAGER:Boa:采矿软件存储库的社区研究基础设施
- 批准号:
1349153 - 财政年份:2013
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
SHF: Small: Phase-Based Tuning for Better Utilization of Performance-Asymmetric Multicores
SHF:小型:基于相位的调整,以更好地利用性能不对称的多核
- 批准号:
1117937 - 财政年份:2011
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
SHF: Small: Collaborative Research: Balancing Expressiveness and Modular Reasoning for Aspect-oriented Programming
SHF:小型:协作研究:平衡面向方面编程的表达性和模块化推理
- 批准号:
1017334 - 财政年份:2010
- 资助金额:
$ 142.69万 - 项目类别:
Continuing Grant
CAREER: On Mutualism of Modularity and Concurrency Goals
职业:模块化和并发目标的互惠性
- 批准号:
0846059 - 财政年份:2009
- 资助金额:
$ 142.69万 - 项目类别:
Continuing Grant
相似国自然基金
膜整联蛋白β8入核调控En1-SP1磷酸化在硬腭黏膜无瘢痕愈合中的作用研究
- 批准号:82370928
- 批准年份:2023
- 资助金额:48 万元
- 项目类别:面上项目
CDots调控EN1抑制纤维化促进头颈部放射性溃疡愈合的作用和机制研究
- 批准号:82301026
- 批准年份:2023
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
向心性动态收缩水凝胶缓释P17抑制EN1基因激活在无瘢痕愈合中的应用及机制研究
- 批准号:
- 批准年份:2022
- 资助金额:30 万元
- 项目类别:青年科学基金项目
乌梅麝香膏通过抑制En1介导的促纤维化在治疗增生性瘢痕中的作用及机制研究
- 批准号:
- 批准年份:2022
- 资助金额:51 万元
- 项目类别:面上项目
向心性动态收缩水凝胶缓释P17抑制EN1基因激活在无瘢痕愈合中的应用及机制研究
- 批准号:82203961
- 批准年份:2022
- 资助金额:30.00 万元
- 项目类别:青年科学基金项目
相似海外基金
Conference: GAeL XXXI (Geometrie Algebrique en Liberte)
会议:GAeL XXXI(自由几何代数)
- 批准号:
2408333 - 财政年份:2024
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
Creating and Sustaining Noyce Mentors en la Frontera: a HSI Collaborative Capacity Building Grant
在拉弗龙特拉创建和维持诺伊斯导师:HSI 协作能力建设补助金
- 批准号:
2345011 - 财政年份:2024
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
Planification de l'analyse contextuelle de la collecte de données équitables dans les dossiers médicaux et de santé électroniques au Québec
魁北克医疗和电子档案收集的唐尼斯和电子档案的背景分析计划
- 批准号:
487913 - 财政年份:2023
- 资助金额:
$ 142.69万 - 项目类别:
Miscellaneous Programs
Conference: GAeL 2023 (Geometrie Algebrique en Liberte)
会议:GAeL 2023(Geometrie Algebrique en Liberte)
- 批准号:
2309424 - 财政年份:2023
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant
RCN: GOLD-EN: Virtual Ice Community Engagement
RCN:GOLD-EN:虚拟冰社区参与
- 批准号:
2329416 - 财政年份:2023
- 资助金额:
$ 142.69万 - 项目类别:
Standard Grant