SHF:Small: Mega-Transfer: On the Value of Learning from 10,000+ Software Projects

SHF:Small:Mega-Transfer:论从 10,000 个软件项目中学习的价值

基本信息

  • 批准号:
    1908762
  • 负责人:
  • 金额:
    $ 47.2万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2019
  • 资助国家:
    美国
  • 起止时间:
    2019-10-01 至 2024-09-30
  • 项目状态:
    已结题

项目摘要

As more and more software and software-development artifacts have accumulated in large repositories, Software Engineering has become a Big Data Science. Software analytics is a subfield of Software Engineering in which the software-project data is analyzed to gain actionable information that helps practitioners track and improve software-development practices. Research in software analytics seeks to develop better models, methods and tools to support, for example, software-defect prediction, using software production and programmer activity data. The first decade of software analytics has generated specific results about specific projects, but it remains difficult to generalize across many projects so that results on one project can be applied to other projects. As in any big-data science, a central question is how much data, and of what quality, is needed to draw valid and useful conclusions that can generalize across multiple projects. A typical research study in software analytics looks at no more than a few dozen projects, which limits the validity and usefulness of results in the field. The project will explore the sufficiency and limits of data for transfer learning across domains. The ultimate goal is to scale software analytics, particularly transfer learning of nine extensively studied software-analytics tasks, to 10,000+ open-source projects and 1,500+ commercial projects. The result is software-quality prediction models, backed by large-scale quantitative studies, that can guide the development and maintenance of software, thus reducing the overall cost of creating and maintaining software.The technical challenges of this work include scalability of the algorithms and the ability to transfer lessons learned between projects. To address these challenges this project will develop innovative transfer-learning methods based on fast linear-time clustering algorithms and fast stream-mining algorithms that use incremental hyper-parameter optimization and clustering. The techniques will find similar projects in instance space (within each cluster) in order to find candidates for transfer. Further, where possible, this project will reduce the transfer cost by pre-studies that perform feature selection on the source and target data. Where it is found that software knowledge is highly localized, then this project will also develop and deploy optimization methods for large scale instance-based learning methods.This award reflects NSF's statutory mission and has been deemed worthy of support through evaluation using the Foundation's intellectual merit and broader impacts review criteria.
随着越来越多的软件和软件开发工件在大型存储库中积累,软件工程已经成为一门大数据科学。 软件分析是软件工程的一个子领域,其中分析软件项目数据以获得可操作的信息,帮助从业者跟踪和改进软件开发实践。软件分析的研究旨在开发更好的模型,方法和工具,以支持例如使用软件生产和程序员活动数据的软件缺陷预测。软件分析的第一个十年已经产生了关于特定项目的特定结果,但仍然很难在许多项目中进行概括,以便将一个项目的结果应用于其他项目。 与任何大数据科学一样,一个核心问题是需要多少数据以及什么质量的数据才能得出有效和有用的结论,这些结论可以在多个项目中推广。 软件分析领域的一个典型的研究项目不超过几十个,这限制了该领域结果的有效性和实用性。该项目将探索跨领域迁移学习数据的充分性和局限性。 最终目标是扩展软件分析,特别是将九个广泛研究的软件分析任务的学习转移到10,000多个开源项目和1,500多个商业项目。其结果是软件质量预测模型,由大规模的定量研究,可以指导软件的开发和维护,从而降低创建和维护软件的总成本。这项工作的技术挑战包括算法的可扩展性和在项目之间转移经验教训的能力。为了应对这些挑战,该项目将开发基于快速线性时间聚类算法和快速流挖掘算法的创新迁移学习方法,这些算法使用增量超参数优化和聚类。 该技术将在实例空间(每个集群内)中找到类似的项目,以便找到转移的候选项目。此外,在可能的情况下,该项目将通过对源数据和目标数据进行特征选择的预先研究来降低传输成本。如果发现软件知识高度本地化,则该项目还将为大规模基于实例的学习方法开发和部署优化方法。该奖项反映了NSF的法定使命,并通过使用基金会的知识价值和更广泛的影响审查标准进行评估,被认为值得支持。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Timothy Menzies其他文献

Timothy Menzies的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Timothy Menzies', 18)}}的其他基金

Elements: Can Empirical SE be Adapted to Computational Science?
要素:经验SE可以适应计算科学吗?
  • 批准号:
    1931425
  • 财政年份:
    2019
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
EAGER: Empirical Software Engineering for Computational Science
EAGER:计算科学的实证软件工程
  • 批准号:
    1826574
  • 财政年份:
    2018
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
SHF: Medium: Scalable Holistic Autotuning for Software Analytics
SHF:中:用于软件分析的可扩展整体自动调整
  • 批准号:
    1703487
  • 财政年份:
    2017
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Continuing Grant
SHF: Medium: Collaborative: Transfer Learning in Software Engineering
SHF:媒介:协作:软件工程中的迁移学习
  • 批准号:
    1506586
  • 财政年份:
    2014
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Continuing Grant
SHF: Medium: Collaborative: Transfer Learning in Software Engineering
SHF:媒介:协作:软件工程中的迁移学习
  • 批准号:
    1302216
  • 财政年份:
    2013
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Continuing Grant
Planning Future Directions in SE & AI
规划东南部未来方向
  • 批准号:
    1252557
  • 财政年份:
    2012
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
SHF: Small: Collaborative Research: Better Comprehension of Software Engineering Data
SHF:小型:协作研究:更好地理解软件工程数据
  • 批准号:
    1017330
  • 财政年份:
    2010
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Continuing Grant
CPA-SEL: Automated Quality Prediction: Exploiting Knowledge of the Business Case
CPA-SEL:自动质量预测:利用业务案例知识
  • 批准号:
    0810879
  • 财政年份:
    2008
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
    n/a
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Powering Small Craft with a Novel Ammonia Engine
用新型氨发动机为小型船只提供动力
  • 批准号:
    10099896
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Collaborative R&D
"Small performances": investigating the typographic punches of John Baskerville (1707-75) through heritage science and practice-based research
“小型表演”:通过遗产科学和基于实践的研究调查约翰·巴斯克维尔(1707-75)的印刷拳头
  • 批准号:
    AH/X011747/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Research Grant
Fragment to small molecule hit discovery targeting Mycobacterium tuberculosis FtsZ
针对结核分枝杆菌 FtsZ 的小分子片段发现
  • 批准号:
    MR/Z503757/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Research Grant
Bacteriophage control of host cell DNA transactions by small ORF proteins
噬菌体通过小 ORF 蛋白控制宿主细胞 DNA 交易
  • 批准号:
    BB/Y004426/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Research Grant
Windows for the Small-Sized Telescope (SST) Cameras of the Cherenkov Telescope Array (CTA)
切伦科夫望远镜阵列 (CTA) 小型望远镜 (SST) 相机的窗口
  • 批准号:
    ST/Z000017/1
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Research Grant
CSR: Small: Leveraging Physical Side-Channels for Good
CSR:小:利用物理侧通道做好事
  • 批准号:
    2312089
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
CSR: Small: Multi-FPGA System for Real-time Fraud Detection with Large-scale Dynamic Graphs
CSR:小型:利用大规模动态图进行实时欺诈检测的多 FPGA 系统
  • 批准号:
    2317251
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
AF: Small: Problems in Algorithmic Game Theory for Online Markets
AF:小:在线市场的算法博弈论问题
  • 批准号:
    2332922
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
Collaborative Research: FET: Small: Algorithmic Self-Assembly with Crisscross Slats
合作研究:FET:小型:十字交叉板条的算法自组装
  • 批准号:
    2329908
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
NeTS: Small: ML-Driven Online Traffic Analysis at Multi-Terabit Line Rates
NeTS:小型:ML 驱动的多太比特线路速率在线流量分析
  • 批准号:
    2331111
  • 财政年份:
    2024
  • 资助金额:
    $ 47.2万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了