SHF: Small: Collaborative Research:Text Retrieval in Software Engineering 2.0

SHF:小型:协作研究:软件工程中的文本检索 2.0

基本信息

  • 批准号:
    1526118
  • 负责人:
  • 金额:
    $ 20万
  • 依托单位:
  • 依托单位国家:
    美国
  • 项目类别:
    Standard Grant
  • 财政年份:
    2015
  • 资助国家:
    美国
  • 起止时间:
    2015-09-01 至 2019-08-31
  • 项目状态:
    已结题

项目摘要

Software systems contain large amounts of textual information captured in various software artifacts, such as, requirements documents, source code, user manuals, etc. The productivity of software developers and the quality of the software they produce directly depends on their ability to retrieve and understand the textual information present in software. Since humans cannot process and comprehend so much text, researchers proposed the use of text retrieval techniques to help software developers with many of their daily tasks. In order to be useful, these techniques need to be properly configured, which requires calibrating many parameters. As most software developers are not experts in text retrieval, they need help in determining the best text retrieval configuration in a given software engineering context. The configuration problem is one of the main obstacles in the adoption of such techniques in the software industry, because many approaches proposed by researchers do not generalize well. The outcomes of this project will transform the way software developers address many of their daily tasks, allowing them to easily adopt the use of text retrieval during software development. The results of this research will also be used in software engineering courses to support students in their projects. The new practices that the students will acquire will help them become better software engineers. The proposed research also brings together work from different computing research communities: software engineering and information retrieval and it will bring new knowledge in both fields. Existing approaches using text retrieval in software engineering will become more practical, rather than just promising, facilitating migration from the lab into industry and academia.The outcome of this research will be: (1) a novel approach (called TRinSE2.0), which will achieve automatic, runtime query-based text retrieval configuration; and (2) improvements to important software engineering tasks, in practical settings, focusing on feature and bug location, impact analysis, traceability link recovery, and bug triage. TRinSE2.0 will be evaluated on open source data, in the classroom, and in industrial settings. The proposed work will transform the way text retrieval configuration is done in software engineering applications. New, software-specific measures, as well as proven linguistic-based measures will be used to capture query properties in the context of software engineering tasks and data sets. Machine learning algorithms will find the best configuration for a given query. When writing a query to retrieve information from a software project, developers will get the best results, saving them time and effort, improving their productivity and the quality of their work. The text retrieval configuration problem will no longer be heuristic-based, but it will become data-driven.
软件系统包含了大量的文本信息,这些文本信息被捕获在各种软件工件中,例如需求文档、源代码、用户手册等。软件开发人员的生产力和他们生产的软件的质量直接取决于他们检索和理解软件中存在的文本信息的能力。 由于人类无法处理和理解如此多的文本,研究人员提出使用文本检索技术来帮助软件开发人员完成许多日常任务。 为了有用,这些技术需要适当配置,这需要校准许多参数。 由于大多数软件开发人员都不是文本检索方面的专家,因此他们需要帮助来确定给定软件工程环境中的最佳文本检索配置。 配置问题是软件行业采用此类技术的主要障碍之一,因为研究人员提出的许多方法都不能很好地推广。 该项目的成果将改变软件开发人员处理许多日常任务的方式,使他们能够在软件开发过程中轻松采用文本检索。 这项研究的结果也将用于软件工程课程,以支持学生在他们的项目。 学生将获得的新实践将帮助他们成为更好的软件工程师。 拟议的研究还汇集了来自不同计算研究社区的工作:软件工程和信息检索,它将在这两个领域带来新的知识。 现有的在软件工程中使用文本检索的方法将变得更加实用,而不仅仅是有前途,促进从实验室迁移到工业和学术界。(称为TRinSE2.0),它将实现自动的、运行时基于查询的文本检索配置;以及(2)在实际环境中对重要软件工程任务的改进,重点是功能和错误定位、影响分析、可追溯性链接恢复和错误分类。 TRinSE2.0将在课堂和工业环境中对开源数据进行评估。 所提出的工作将改变文本检索配置在软件工程应用中的方式。 新的,特定于软件的措施,以及经过验证的基于语言的措施将被用来捕捉查询属性的软件工程任务和数据集的背景下。 机器学习算法将为给定的查询找到最佳配置。 在编写查询以从软件项目中检索信息时,开发人员将获得最佳结果,节省他们的时间和精力,提高他们的生产力和工作质量。 文本检索配置问题将不再是基于知识的,而是数据驱动的。

项目成果

期刊论文数量(0)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

数据更新时间:{{ journalArticles.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ monograph.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ sciAawards.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ conferencePapers.updateTime }}

{{ item.title }}
  • 作者:
    {{ item.author }}

数据更新时间:{{ patent.updateTime }}

Andrian Marcus其他文献

Text Retrieval Approaches for Concept Location in Source Code
源代码中概念定位的文本检索方法
Using information retrieval to support design of incremental change of software
使用信息检索支持软件增量变更设计
Evolving a Project-Based Software Engineering Course: A Case Study
发展基于项目的软件工程课程:案例研究
Adapting to online teaching in software engineering courses
适应软件工程课程在线教学
JIRiSS - an Eclipse plug-in for Source Code Exploration
JIRiSS - 用于源代码探索的 Eclipse 插件

Andrian Marcus的其他文献

{{ item.title }}
{{ item.translation_title }}
  • DOI:
    {{ item.doi }}
  • 发表时间:
    {{ item.publish_year }}
  • 期刊:
  • 影响因子:
    {{ item.factor }}
  • 作者:
    {{ item.authors }}
  • 通讯作者:
    {{ item.author }}

{{ truncateString('Andrian Marcus', 18)}}的其他基金

Collaborative Research: SHF: Medium: Bug Report Management 2.0
协作研究:SHF:中:错误报告管理 2.0
  • 批准号:
    1955837
  • 财政年份:
    2020
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
EAGER: Automatic Identification of Bug Description Elements
EAGER:自动识别错误描述元素
  • 批准号:
    1848608
  • 财政年份:
    2018
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
CAREER: Management of Unstructured Information During Software Evolution
职业:软件演进过程中非结构化信息的管理
  • 批准号:
    1514460
  • 财政年份:
    2014
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
CI-P: Collaborative Research: Advanced Text Analysis Infrastructure for Software Engineering
CI-P:协作研究:软件工程的高级文本分析基础设施
  • 批准号:
    1205310
  • 财政年份:
    2012
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
SHF: Small: Collaborative Research: Better Comprehension of Software Engineering Data
SHF:小型:协作研究:更好地理解软件工程数据
  • 批准号:
    1017263
  • 财政年份:
    2010
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
CAREER: Management of Unstructured Information During Software Evolution
职业:软件演进过程中非结构化信息的管理
  • 批准号:
    0845706
  • 财政年份:
    2009
  • 资助金额:
    $ 20万
  • 项目类别:
    Continuing Grant
SRS-CCF: Supporting Software Evolution by the Combined Analysis of Textual and Structural Information
SRS-CCF:通过文本和结构信息的组合分析支持软件演进
  • 批准号:
    0820133
  • 财政年份:
    2008
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant

相似国自然基金

昼夜节律性small RNA在血斑形成时间推断中的法医学应用研究
  • 批准号:
  • 批准年份:
    2024
  • 资助金额:
    0.0 万元
  • 项目类别:
    省市级项目
tRNA-derived small RNA上调YBX1/CCL5通路参与硼替佐米诱导慢性疼痛的机制研究
  • 批准号:
  • 批准年份:
    2022
  • 资助金额:
    10.0 万元
  • 项目类别:
    省市级项目
Small RNA调控I-F型CRISPR-Cas适应性免疫性的应答及分子机制
  • 批准号:
    32000033
  • 批准年份:
    2020
  • 资助金额:
    24.0 万元
  • 项目类别:
    青年科学基金项目
Small RNAs调控解淀粉芽胞杆菌FZB42生防功能的机制研究
  • 批准号:
    31972324
  • 批准年份:
    2019
  • 资助金额:
    58.0 万元
  • 项目类别:
    面上项目
变异链球菌small RNAs连接LuxS密度感应与生物膜形成的机制研究
  • 批准号:
    81900988
  • 批准年份:
    2019
  • 资助金额:
    21.0 万元
  • 项目类别:
    青年科学基金项目
肠道细菌关键small RNAs在克罗恩病发生发展中的功能和作用机制
  • 批准号:
    31870821
  • 批准年份:
    2018
  • 资助金额:
    56.0 万元
  • 项目类别:
    面上项目
基于small RNA 测序技术解析鸽分泌鸽乳的分子机制
  • 批准号:
    31802058
  • 批准年份:
    2018
  • 资助金额:
    26.0 万元
  • 项目类别:
    青年科学基金项目
Small RNA介导的DNA甲基化调控的水稻草矮病毒致病机制
  • 批准号:
    31772128
  • 批准年份:
    2017
  • 资助金额:
    60.0 万元
  • 项目类别:
    面上项目
基于small RNA-seq的针灸治疗桥本甲状腺炎的免疫调控机制研究
  • 批准号:
    81704176
  • 批准年份:
    2017
  • 资助金额:
    20.0 万元
  • 项目类别:
    青年科学基金项目
水稻OsSGS3与OsHEN1调控small RNAs合成及其对抗病性的调节
  • 批准号:
    91640114
  • 批准年份:
    2016
  • 资助金额:
    85.0 万元
  • 项目类别:
    重大研究计划

相似海外基金

Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331302
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: LEGAS: Learning Evolving Graphs At Scale
协作研究:SHF:小型:LEGAS:大规模学习演化图
  • 批准号:
    2331301
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Efficient and Scalable Privacy-Preserving Neural Network Inference based on Ciphertext-Ciphertext Fully Homomorphic Encryption
合作研究:SHF:小型:基于密文-密文全同态加密的高效、可扩展的隐私保护神经网络推理
  • 批准号:
    2412357
  • 财政年份:
    2024
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Technical Debt Management in Dynamic and Distributed Systems
合作研究:SHF:小型:动态和分布式系统中的技术债务管理
  • 批准号:
    2232720
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
  • 批准号:
    2326895
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Enabling Efficient 3D Perception: An Architecture-Algorithm Co-Design Approach
协作研究:SHF:小型:实现高效的 3D 感知:架构-算法协同设计方法
  • 批准号:
    2334624
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
  • 批准号:
    2234921
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Reimagining Communication Bottlenecks in GNN Acceleration through Collaborative Locality Enhancement and Compression Co-Design
协作研究:SHF:小型:通过协作局部性增强和压缩协同设计重新想象 GNN 加速中的通信瓶颈
  • 批准号:
    2326494
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Quasi Weightless Neural Networks for Energy-Efficient Machine Learning on the Edge
合作研究:SHF:小型:用于边缘节能机器学习的准失重神经网络
  • 批准号:
    2326894
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
Collaborative Research: SHF: Small: Sub-millisecond Topological Feature Extractor for High-Rate Machine Learning
合作研究:SHF:小型:用于高速机器学习的亚毫秒拓扑特征提取器
  • 批准号:
    2234920
  • 财政年份:
    2023
  • 资助金额:
    $ 20万
  • 项目类别:
    Standard Grant
{{ showInfoDetail.title }}

作者:{{ showInfoDetail.author }}

知道了