論文の概要: Quantifying and Characterizing Clones of Self-Admitted Technical Debt in
Build Systems
- arxiv url: http://arxiv.org/abs/2402.08920v1
- Date: Wed, 14 Feb 2024 03:34:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-15 17:12:40.329268
- Title: Quantifying and Characterizing Clones of Self-Admitted Technical Debt in
Build Systems
- Title(参考訳): ビルドシステムにおける自己充足型技術的負債のクローンの定量化と評価
- Authors: Tao Xiao, Zhili Zeng, Dong Wang, Hideaki Hata, Shane McIntosh, Kenichi
Matsumoto
- Abstract要約: Self-Admitted Technical Debt (SATD)は、長期的なソフトウェアアーチファクトの品質を短期的な目標のために意図的に交換する開発判断に注釈を付ける。
最近の研究は、ソースコードにSATDクローン(重複またはほぼ重複するSATDコメント)が存在することを探っている。
我々はAutotools、CMake、Maven、Antビルドシステムから抽出された50,608個のSATDコメントについて大規模な研究を行っている。
- 参考スコア(独自算出の注目度): 10.81072153747528
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-Admitted Technical Debt (SATD) annotates development decisions that
intentionally exchange long-term software artifact quality for short-term
goals. Recent work explores the existence of SATD clones (duplicate or near
duplicate SATD comments) in source code. Cloning of SATD in build systems
(e.g., CMake and Maven) may propagate suboptimal design choices, threatening
qualities of the build system that stakeholders rely upon (e.g.,
maintainability, reliability, repeatability). Hence, we conduct a large-scale
study on 50,608 SATD comments extracted from Autotools, CMake, Maven, and Ant
build systems to investigate the prevalence of SATD clones and to characterize
their incidences. We observe that: (i) prior work suggests that 41-65% of SATD
comments in source code are clones, but in our studied build system context,
the rates range from 62% to 95%, suggesting that SATD clones are a more
prevalent phenomenon in build systems than in source code; (ii) statements
surrounding SATD clones are highly similar, with 76% of occurrences having
similarity scores greater than 0.8; (iii) a quarter of SATD clones are
introduced by the author of the original SATD statements; and (iv) among the
most commonly cloned SATD comments, external factors (e.g., platform and tool
configuration) are the most frequent locations, limitations in tools and
libraries are the most frequent causes, and developers often copy SATD comments
that describe issues to be fixed later. Our work presents the first step toward
systematically understanding SATD clones in build systems and opens up avenues
for future work, such as distinguishing different SATD clone behavior, as well
as designing an automated recommendation system for repaying SATD effectively
based on resolved clones.
- Abstract(参考訳): Self-Admitted Technical Debt (SATD)は、長期的なソフトウェアアーチファクトの品質を短期的な目標のために意図的に交換する開発判断に注釈を付ける。
最近の研究は、ソースコードにSATDクローン(重複またはほぼ重複するSATDコメント)が存在することを探っている。
ビルドシステム(CMakeやMavenなど)におけるSATDのクローン化は、最適な設計選択を伝播させ、ステークホルダーが依存するビルドシステムの品質(保守性、信頼性、再現性など)を脅かす可能性がある。
そこで我々は,オートツール,CMake,Maven,Antビルドシステムから抽出した50,608個のSATDコメントを大規模に調査し,SATDクローンの出現状況を調査し,その頻度を特徴付ける。
私たちはそれを観察します
(i)以前の研究では,ソースコード中のSATDコメントの41~65%がクローンであることが示唆されているが,本研究ではビルドシステムのコンテキストにおいて,SATDクローンはソースコードよりもビルドシステムでよく見られる現象であることが示唆された。
(ii)SATDクローンを取り巻くステートメントは極めて類似しており、76%が0.8以上の類似性スコアを有する。
(iii)SATDクローンの4分の1は、オリジナルのSATD文の著者によって導入され、
(iv)最も一般的にクローン化されたsatdコメントのうち、外部要因(プラットフォームやツール構成など)が最も頻繁な場所であり、ツールやライブラリの制限が最も頻繁な原因であり、開発者は後で修正すべき問題を記述するsatdコメントをコピーすることが多い。
本研究は,ビルドシステムにおけるSATDクローンの体系的理解に向けた第一歩であり,様々なSATDクローン動作の識別や,解決されたクローンに基づいてSATDを効果的に返済するための自動レコメンデーションシステムの設計など,今後の作業への道を開くものである。
関連論文リスト
- Deep Learning and Data Augmentation for Detecting Self-Admitted Technical Debt [6.004718679054704]
Self-Admitted Technical Debt (SATD)は、開発者がテキストアーティファクトを使用して、既存の実装が最適でない理由を説明する状況を指す。
SATD と BERT のバイナリ識別に BiLSTM アーキテクチャを用い,様々な SATD の分類を行った。
異なるアーティファクトから派生した様々なデータセットからSATDを識別・分類するための2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-21T09:22:16Z) - An Exploratory Study of the Relationship between SATD and Other Software Development Activities [13.026170714454071]
Self-Admitted Technical Debt (SATD)は、開発者が負債を思い出させるためにコードをドキュメント化する、特定のタイプのTechnical Debtである。
これまでの研究では、SATDの様々な側面を探求してきた。
本研究ではSATDの削除と追加とバグ修正,新機能の追加,テストなどの活動との関係について検討する。
論文 参考訳(メタデータ) (2024-04-02T13:45:42Z) - AdaCCD: Adaptive Semantic Contrasts Discovery Based Cross Lingual
Adaptation for Code Clone Detection [69.79627042058048]
AdaCCDは、その言語でアノテーションを使わずに、新しい言語のクローンコードを検出する新しい言語間適応手法である。
5つのプログラミング言語からなる多言語コードクローン検出ベンチマークを構築し,AdaCCDの言語間適応性を評価する。
論文 参考訳(メタデータ) (2023-11-13T12:20:48Z) - Who Made This Copy? An Empirical Analysis of Code Clone Authorship [1.1512593234650217]
我々は,GitHubに保管されている153のApacheプロジェクトにおいて,Javaファイルの行レベルの粒度のコードクローンのオーサシップを分析した。
すべてのプロジェクトに対して,相当数のクローンラインがあることが分かりました。
クローン集合の3分の1は、主に複数の主要な著者によって貢献されている。
論文 参考訳(メタデータ) (2023-09-03T08:24:32Z) - On the Security Blind Spots of Software Composition Analysis [46.1389163921338]
Mavenリポジトリで脆弱性のあるクローンを検出するための新しいアプローチを提案する。
Maven Centralから53万以上の潜在的な脆弱性のあるクローンを検索します。
検出された727個の脆弱なクローンを検出し、それぞれに検証可能な脆弱性証明プロジェクトを合成する。
論文 参考訳(メタデータ) (2023-06-08T20:14:46Z) - CONCORD: Clone-aware Contrastive Learning for Source Code [64.51161487524436]
セルフ教師付き事前トレーニングは、多くのダウンストリームSEタスクに価値のあるジェネリックコード表現を学ぶための牽引役になった。
汎用的な表現学習のために、開発者が日々どのようにコードをコーディングするかは、要因としても不可欠である、と私たちは主張する。
特に,表現空間に良性クローンを近づける自己教師型コントラスト学習戦略であるCONCORDを提案する。
論文 参考訳(メタデータ) (2023-06-05T20:39:08Z) - Estimating the hardness of SAT encodings for Logical Equivalence
Checking of Boolean circuits [58.83758257568434]
LEC インスタンスの SAT 符号化の硬さは SAT パーティショニングでは textitw.r. と推定できることを示す。
そこで本研究では, SAT符号化の難易度を精度良く推定できるパーティショニング法を提案する。
論文 参考訳(メタデータ) (2022-10-04T09:19:13Z) - Automatic Identification of Self-Admitted Technical Debt from Four
Different Sources [3.446864074238136]
技術的負債とは、ソフトウェアシステムの長期的な保守性と進化性を犠牲にして、短期的な目標を達成するためにショートカットを取ることを指す。
これまでの作業は、ソースコードコメントとイシュートラッカからSATDを識別することに集中していた。
ソースコードコメント,コミットメッセージ,プルリクエスト,イシュートラッキングシステムという4つのソースを統合したSATDの自動識別手法を提案する。
論文 参考訳(メタデータ) (2022-02-04T20:59:25Z) - Identifying Self-Admitted Technical Debt in Issue Tracking Systems using
Machine Learning [3.446864074238136]
技術的負債は短期的利益のために実装された準最適ソリューションのメタファーである。
Self-Admitted Technical Debtの特定に関する作業の多くは、ソースコードのコメントに重点を置いている。
本稿では,機械学習を用いた問題追跡システムにおけるSATDの自動識別手法の提案と最適化を行う。
論文 参考訳(メタデータ) (2022-02-04T15:15:13Z) - Transformer-based Machine Learning for Fast SAT Solvers and Logic
Synthesis [63.53283025435107]
CNFベースのSATとMaxSATは論理合成と検証システムの中心である。
そこで本研究では,Transformerアーキテクチャから派生したワンショットモデルを用いて,MaxSAT問題の解法を提案する。
論文 参考訳(メタデータ) (2021-07-15T04:47:35Z) - Semantic Clone Detection via Probabilistic Software Modeling [69.43451204725324]
本稿では,0%の構文的類似性を有するクローンを検出する意味的クローン検出手法を提案する。
我々は,SCD-PSMをセマンティッククローン検出のための安定かつ高精度なソリューションとして提示する。
論文 参考訳(メタデータ) (2020-08-11T17:54:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。