多様なプログラミング言語に対応可能なコードクローン検出ツールの開発
开发可支持多种编程语言的代码克隆检测工具
基本信息
- 批准号:20K11745
- 负责人:
- 金额:$ 2.41万
- 依托单位:
- 依托单位国家:日本
- 项目类别:Grant-in-Aid for Scientific Research (C)
- 财政年份:2020
- 资助国家:日本
- 起止时间:2020-04-01 至 2024-03-31
- 项目状态:已结题
- 来源:
- 关键词:
项目摘要
コードクローンとは,ソフトウェア開発中にコピーアンドペーストなどにより作成された類似したコード片である.コードクローンは,ソフトウェア保守を困難にする要因の1つであるため,検出し管理する必要がある.1990年代以降,数多くのコードクローン検出ツールが提案されたが,そのほとんどは限られたプログラミング言語のみに対応し,対応言語を増加させることが難しい.プログラミング言語は,頻繁に新規開発や文法の更新が行われるため,対応言語を柔軟に追加可能なコードクローン検出ツールが必要であると考えられる.研究代表者は以前に,対象言語の文法の一部を正規表現として抽出し,対応言語を柔軟に増加できるコードクローン検出ツールを開発した.しかし,正規表現では表現能力が不足しているため,対応できない言語がある.加えて,トークン列の照合に基づきコードクローンを検出するため,ステートメントの追加や削除を行ったコードクローンを検出する能力はない.そこで,多様なプログラミング言語に対応可能であり,ステートメントの追加・削除を許容するコードクローン検出ツールを実装した. 具体的には,パーサジェネレータの1つであるANTLRを使用してソースコード正規化を行い,Token Bagモデルを基にコード片の類似度を計算することによって,検出可能なコードクローンの種類を増加させることを試みた.研究成果を論文にまとめ,国際会議30th IEEE/ACM International Conference on Program Comprehension (ICPC 2022)に投稿し,採録されたため発表を行った.また,大規模ソースコード集合CodeNetを用いた評価実験に取り組んだ.
コードクローンとは, ソフトウェア开発中にコピーアンドしたコード片である.コードクローンは, ソフトウェアConservation is difficult and the reason is にするの1つであるため, 検出しmanagement is necessary がある. Since the 1990s, there have been many proposals for くのコードクローン検ツールがされたが, そのほとんどはlimit られたプログラミング语のみに対応し,対応语を Increase and させることがdifficultyしい.プログラミング语は, frequent new rules and regulations, grammar and grammar update, 対応语It is possible to add a soft language to the language. Study the past of the representative, extract the formal expression of part of the grammar of the elephant language ,対応语をsoftに Increaseできるコードクローン検出ツールを开発した.しかし, formal performance では performance ability is not enough しているため, 対応できないlanguage がある. Add it to the listートメントのAdd the ability to remove the line and remove it.そこで,多様なプログラミング语に対応possibleであり,ステートメントのAdded and deleted the するコードクローン検出ツールを実装した. Specific token Bagモデルをbased にコード片のsimilarity calculation することによって, 検出possibleなコードクローンのkindをincreasedさせることをtrialみた. The research results were submitted to the 30th IEEE/ACM International Conference on Program Comprehension (ICPC 2022) and recorded in the paper.また, large-scale ソースコード collection CodeNet を use いたreview価実験にtake りgroup んだ.
项目成果
期刊论文数量(9)
专著数量(0)
科研奖励数量(0)
会议论文数量(0)
专利数量(0)
深層学習を用いたコードクローン検出器の汎化性能に関する調査
使用深度学习研究代码克隆检测器的泛化性能
- DOI:
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:福家 範浩;藤原 裕士;吉田 則裕;崔 恩瀞;井上 克郎
- 通讯作者:井上 克郎
コードクローン検出に基づくIoTを対象とした自動パッチ生成
基于代码克隆检测的物联网自动补丁生成
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:大野 堅太郎;吉田 則裕;朱 文青;高田 広章
- 通讯作者:高田 広章
深層学習を用いたコードクローン検出器のベンチマーク間精度調査
使用深度学习的代码克隆检测器的基准准确性调查
- DOI:
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:福家 範浩;藤原 裕士;吉田 則裕;崔 恩瀞;井上 克郎
- 通讯作者:井上 克郎
A Survey of Approaches for Code Clone Search
代码克隆搜索方法综述
- DOI:10.11309/jssst.39.3_47
- 发表时间:2022
- 期刊:
- 影响因子:0
- 作者:崔 恩瀞;藤原 裕士;吉田 則裕;水野 修
- 通讯作者:水野 修
A Dynamic Improvement of a Training Dataset for Source Code Classification Using Deep Learning
使用深度学习动态改进源代码分类训练数据集
- DOI:10.14923/transinfj.2020pdp0005
- 发表时间:2021
- 期刊:
- 影响因子:0
- 作者:藤原 裕士;崔 恩瀞;吉田 則裕;井上 克郎
- 通讯作者:井上 克郎
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
数据更新时间:{{ journalArticles.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ monograph.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ sciAawards.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ conferencePapers.updateTime }}
{{ item.title }}
- 作者:
{{ item.author }}
数据更新时间:{{ patent.updateTime }}
吉田 則裕其他文献
コードクローンに対するリファクタリング可能性に基づいた削減可能ソースコード量の調査
研究基于代码克隆的可重构性可以减少的源代码量
- DOI:
- 发表时间:
2017 - 期刊:
- 影响因子:0
- 作者:
石津 卓也;吉田 則裕;崔 恩瀞;井上 克郎 - 通讯作者:
井上 克郎
コード片のベクトル表現に基づく大規模コードクローン集合の特徴調査
基于代码片段向量表示的大规模代码克隆集特征研究
- DOI:
- 发表时间:
2018 - 期刊:
- 影响因子:0
- 作者:
横井 一輝;崔 恩瀞;吉田 則裕;井上 克郎 - 通讯作者:
井上 克郎
Matching Automaton for String Pattern with Greedy Semantics
具有贪婪语义的字符串模式匹配自动机
- DOI:
- 发表时间:
2011 - 期刊:
- 影响因子:0
- 作者:
平山 力地;吉田 則裕;飯田 元;Taro Suzuki - 通讯作者:
Taro Suzuki
Fuzz4B: A Support Tool for Fuzzing with AFL
Fuzz4B:使用 AFL 进行模糊测试的支持工具
- DOI:
10.11309/jssst.39.2_124 - 发表时间:
2022 - 期刊:
- 影响因子:0
- 作者:
宮木 龍;吉田 則裕;藤原 賢二;都築 夏樹;山本 椋太;高田 広章 - 通讯作者:
高田 広章
吉田 則裕的其他文献
{{
item.title }}
{{ item.translation_title }}
- DOI:
{{ item.doi }} - 发表时间:
{{ item.publish_year }} - 期刊:
- 影响因子:{{ item.factor }}
- 作者:
{{ item.authors }} - 通讯作者:
{{ item.author }}
{{ truncateString('吉田 則裕', 18)}}的其他基金
ファジングが発見した不具合の自動修正技術
Fuzzing发现的缺陷自动修正技术
- 批准号:
24K02923 - 财政年份:2024
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
デバッグ支援を目的とした類似コードの検出・分類手法
用于调试支持的相似代码检测和分类方法
- 批准号:
08J01964 - 财政年份:2008
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for JSPS Fellows
相似海外基金
Mum's the word... using text analysis to better understand expressions and experiences related to fertility
妈妈的话......使用文本分析来更好地理解与生育相关的表达和经历
- 批准号:
2751132 - 财政年份:2022
- 资助金额:
$ 2.41万 - 项目类别:
Studentship
Chinese Influence Operations through Internet Media in Japan: An Analysis Using the Quantitative Text Analysis
中国人通过网络媒体对日本的影响力运作:基于定量文本分析的分析
- 批准号:
22H00816 - 财政年份:2022
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
科学技術論文における長く複雑な文の構文解析
解析科技论文中的长而复杂的句子
- 批准号:
22K17957 - 财政年份:2022
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Measuring Trust and its Variance during the COVID-19 Pandemic Using Serial Surveys and Quantitative Text Analysis
使用系列调查和定量文本分析衡量 COVID-19 大流行期间的信任及其方差
- 批准号:
ES/W011913/1 - 财政年份:2022
- 资助金额:
$ 2.41万 - 项目类别:
Research Grant
Cross-cultural analysis of changes in news coverage on COVID-19 in Japanese, German and American media combining qualitative text analysis and big data machine learning
结合定性文本分析和大数据机器学习,对日本、德国和美国媒体中关于 COVID-19 的新闻报道变化进行跨文化分析
- 批准号:
21K13444 - 财政年份:2021
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Early-Career Scientists
Innovative Research on Central Bank Politics: Quantitative Text Analysis and Survey Experiment Exploring the Effectiveness of Central Banks
央行政治创新研究:定量文本分析与调查实验探索央行有效性
- 批准号:
21K18417 - 财政年份:2021
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Challenging Research (Exploratory)
Comparative Analysis of Patronal Politics: Quantitative Text Analysis and Experiments
赞助政治的比较分析:定量文本分析和实验
- 批准号:
21H00678 - 财政年份:2021
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (B)
Elections and Political Violence: Inter-regional comparison based on quantitative text analysis and experiments
选举与政治暴力:基于定量文本分析和实验的区域间比较
- 批准号:
20H00067 - 财政年份:2020
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for Scientific Research (A)
Methods for the privacy preserving analysis of sensitive health data: text analysis and data visualisation
敏感健康数据隐私保护分析方法:文本分析与数据可视化
- 批准号:
MR/S003959/2 - 财政年份:2020
- 资助金额:
$ 2.41万 - 项目类别:
Fellowship
実用的な構文解析技術と形式言語理論をつなぐ統一的な理論基盤の構築
建立连接实用句法分析技术和形式语言理论的统一理论基础
- 批准号:
20J23184 - 财政年份:2020
- 资助金额:
$ 2.41万 - 项目类别:
Grant-in-Aid for JSPS Fellows














{{item.name}}会员




