ソフトウェアバグ予測を題材とする機械学習システムの評価技術の開発
基于软件缺陷预测的机器学习系统评估技术开发
基本信息
- 批准号:20K11749
- 负责人:
- 金额:$ 2.75万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
機械学習システムを評価するという課題に対し,特にソフトウェアバグ予測を対象とした方法を提案した.従来,バグ予測においてはprecision,recall,F1値などの評価指標が広く用いられてきたが,しかし,これらの尺度はデータセット中のバグあり/なしの個体の比率(neg/pos ratio)に大きく影響されるため,異なるデータセットに対するバグ予測精度を比較する場合に大きな問題となっていた.例えば,予測精度としてprecision = 0.8もしくはF1 = 0.8といった結果が得られたとしても,データセット中のバグあり(pos)の個体の割合が0.8を超えている場合,この予測は精度が高いとはいえない.そこで,本研究ではneg,posの値に基づいて予測精度の期待値およびそのばらつきを算出し,それらに基づいた尺度であるneg/pos-normalized accuracy measuresを提案した.提案尺度により,異なるデータセットに対する予測精度の比較が可能となるとともに,多数の予測結果をランク付けすることが可能となった.提案尺度の有効性を評価するために,19件のオープンソースソフトウェアプロジェクトのデータセットを用いたケーススタディを行った.その結果,precision < 0.1となるような,従来であれば予測精度が極めて低く,予測に失敗したと判断されていた事例においても,予測が成功であると判断できる場合があることが分かった.また,従来の尺度の中では,MCC (Matthews Correlation Coefficient)は提案尺度と類似する値の傾向を示すため,予測精度を低コストで(confusion matrixのみに基づいて)評価したい場合には,MCCを用いることが望ましいことが分かった.
Machine learning is the most important part of the project. In the future, the prediction accuracy will be greatly affected by the ratio of the individual units in the prediction accuracy comparison. For example, if the prediction accuracy is 0.8, then F1 = 0.8, then the prediction accuracy is high. In this study, we propose neg/pos-normalized accuracy measures to calculate the expected value of the accuracy of the prediction. A comparison of the prediction accuracy of the proposed scale is possible, and most of the prediction results are possible. 19 pieces of software are available for evaluation. For example, the prediction accuracy is extremely low, the prediction fails, the judgment fails, the prediction succeeds, the judgment fails, and the case fails. The MCC (Matthews Correlation Coefficient) has a tendency to estimate the similarity of the proposed scale and the prediction accuracy.
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
Association Metrics Between Two Continuous Variables for Software Project Data
软件项目数据的两个连续变量之间的关联度量
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:Takumi Kanehira;Akito Monden;Zeynep Yucel
- 通讯作者:Zeynep Yucel
A Dynamic Model Selection Approach to Mitigate the Change of Balance Problem in Cross-Version Bug Prediction
缓解跨版本错误预测中平衡问题的动态模型选择方法
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:Hiroshi Demanou;Akito Monden;Masateru Tsunoda
- 通讯作者:Masateru Tsunoda
Improvement and Evaluation of Data Consistency Metric CIL for Software Engineering Data Sets
软件工程数据集数据一致性度量CIL的改进与评估
- DOI:10.1109/access.2022.3188246
- 发表时间:2022
- 期刊:
- 影响因子:3.9
- 作者:Maohua Gan;Zeynep Yucel;Akito Monden
- 通讯作者:Akito Monden
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
門田 暁人其他文献
移動窓によるソフトウェアバグの行レベル予測の試み
使用移动窗口对软件错误进行行级预测的尝试
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
福谷 圭吾;門田 暁人;ユジャイ ゼイネップ;畑 秀明 - 通讯作者:
畑 秀明
ソフトウェアテストにおける静的解析ツールの段階的適用による不具合修正工数の更なる低減 ―民生用音響・映像機器向け組み込みソフトウェア開発へのQACの段階的適用とその実証評価―
通过在软件测试中逐步应用静态分析工具,进一步减少缺陷修复工时 - QAC逐步应用于消费类视听设备的嵌入式软件开发及其实证评估 -
- DOI:
- 发表时间:
2016 - 期刊:
- 影响因子:0
- 作者:
鶴田 雅明;大平 雅雄;門田 暁人;松本 健一 - 通讯作者:
松本 健一
11種類のfault密度予測モデルの実証的評価
11种故障密度预测模型的实证评价
- DOI:
- 发表时间:
2013 - 期刊:
- 影响因子:0
- 作者:
小林 寛武;戸田 航史;亀井 靖高;門田 暁人;峯 恒憲;鵜林 尚靖 - 通讯作者:
鵜林 尚靖
Operating System Resource Management for FPGA
FPGA 操作系统资源管理
- DOI:
- 发表时间:
2020 - 期刊:
- 影响因子:0
- 作者:
田中 和也;門田 暁人;Zeynep Yucel;高井利憲;三宅 武将,福間 慎治,森 眞一郎;Satoshi Fujita;Shuichi Oikawa - 通讯作者:
Shuichi Oikawa
即効!開発リーダーとメンバーに役に立つソフトウェアメトリクス ~今あるデータを有効に活用するリポジトリマイニングのノウハウ~
立竿见影效果!
- DOI:
- 发表时间:
- 期刊:
- 影响因子:0
- 作者:
荒巻;今井;坂本;門田 暁人 - 通讯作者:
門田 暁人
門田 暁人的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('門田 暁人', 18)}}的其他基金
例外ルールを用いたソフトウェア開発データの解析
使用异常规则分析软件开发数据
- 批准号:
24K14896 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
Javaプログラムの逆コンパイル防止方法
如何防止Java程序被反编译
- 批准号:
15700032 - 财政年份:2003
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
Javaプログラムを対象とした難読化法
Java程序的混淆方法
- 批准号:
13780237 - 财政年份:2001
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Young Scientists (B)
ソフトウェア電子透かし法の提案と評価
软件数字水印方法的提出与评估
- 批准号:
11780308 - 财政年份:1999
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Encouragement of Young Scientists (A)
相似海外基金
機械学習アルゴリズムを用いた敗血症性凝固線溶障害の早期予測モデルの開発
使用机器学习算法开发脓毒性凝血和纤溶性疾病的早期预测模型
- 批准号:
24K12133 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
アニーリングと機械学習の融合による説明可能AI基盤の研究
结合退火和机器学习研究可解释的人工智能基础设施
- 批准号:
24KJ1081 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for JSPS Fellows
機械学習による滑走路の離着陸容量の短期的予測手法に関する研究
基于机器学习的跑道起降能力短期预测方法研究
- 批准号:
24K07722 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
機械学習を用いた波形解析による高速中性子エネルギー測定法の技術開拓
利用机器学习进行波形分析的快中子能量测量方法的技术开发
- 批准号:
24K08298 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
調理シミュレーションと機械学習の融合および非接触計測による加熱制御システムの構築
结合烹饪模拟与机器学习和非接触测量构建加热控制系统
- 批准号:
24K05572 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
肝臓内酸素動態を含む透析低血圧発症予知モデルの構築:統計・機械学習分析による解析
构建预测透析低血压发作(包括肝内氧动态)的模型:使用统计和机器学习分析进行分析
- 批准号:
24K15796 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
臨床情報による高精度分娩進行予測モデルの開発: 機械学習の活用
利用临床信息开发高精度的分娩进展预测模型:利用机器学习
- 批准号:
24K13948 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
新興感染症のシステマティック・レビューを機械学習を用いて簡易に実施するための研究
利用机器学习轻松对新发传染病进行系统评价的研究
- 批准号:
24K13518 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
独立成分分析を活用した信頼性の高い機械学習手法の構築
使用独立成分分析构建可靠的机器学习方法
- 批准号:
24K15093 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)
学習過程情報に基づき理由を説明可能な高速論理型機械学習器の開発の提案
开发可根据学习过程信息解释原因的高速逻辑机器学习装置的提案
- 批准号:
24K15095 - 财政年份:2024
- 资助金额:
$ 2.75万 - 项目类别:
Grant-in-Aid for Scientific Research (C)