論文の概要: A First Look at the Self-Admitted Technical Debt in Test Code: Taxonomy and Detection
- arxiv url: http://arxiv.org/abs/2510.22409v1
- Date: Sat, 25 Oct 2025 19:09:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:15.125104
- Title: A First Look at the Self-Admitted Technical Debt in Test Code: Taxonomy and Detection
- Title(参考訳): テストコードにおける自己充足型技術的負債:分類学と検出
- Authors: Shahidul Islam, Md Nahidul Islam Opu, Shaowei Wang, Shaiful Chowdhury,
- Abstract要約: 自己承認技術的負債(Self-admitted Technical debt,SATD)とは、開発者がコードの問題や回避策、あるいは準最適ソリューションを明確に認めるコメントのことである。
本研究では,1000のオープンソースJavaプロジェクトを対象に,160万件のコメントからランダムに5万件のコメントをランダムに分析することにより,SATDをテストコードで解析する。
- 参考スコア(独自算出の注目度): 7.475625941772781
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Self-admitted technical debt (SATD) refers to comments in which developers explicitly acknowledge code issues, workarounds, or suboptimal solutions. SATD is known to significantly increase software maintenance effort. While extensive research has examined SATD in source code, its presence and impact in test code have received no focused attention, leaving a significant gap in our understanding of how SATD manifests in testing contexts. This study, the first of its kind, investigates SATD in test code by manually analyzing 50,000 comments randomly sampled from 1.6 million comments across 1,000 open-source Java projects. From this sample, after manual analysis and filtering, we identified 615 SATD comments and classified them into 15 distinct categories, building a taxonomy of test code SATD. To investigate whether test code SATD can be detected automatically, we evaluated existing SATD detection tools, as well as both open-source and proprietary LLMs. Among the existing tools, MAT performed the best, albeit with moderate recall. To our surprise, both open-source and proprietary LLMs exhibited poor detection accuracy, primarily due to low precision. These results indicate that neither existing approaches nor current LLMs can reliably detect SATD in test code. Overall, this work provides the first large-scale analysis of SATD in test code, a nuanced understanding of its types, and the limitations of current SATD detection methods. Our findings lay the groundwork for future research on test code-specific SATD.
- Abstract(参考訳): 自己承認技術的負債(Self-admitted Technical debt,SATD)とは、開発者がコードの問題や回避策、あるいは準最適ソリューションを明確に認めるコメントのことである。
SATDはソフトウェアのメンテナンスを著しく向上させることが知られている。
ソースコードにおけるSATDについて広範な研究が行われてきたが、テストコードにおけるSATDの存在と影響は注目されていない。
この調査は、1000のオープンソースJavaプロジェクトにわたる1.6万のコメントからランダムにサンプリングされた5万のコメントを手動で分析することで、SATDをテストコードで調査する。
このサンプルから手動による解析とフィルタリングを行い、615のSATDコメントを同定し、15のカテゴリに分類し、SATDの分類を構築した。
テストコードSATDを自動的に検出できるかどうかを調べるため,既存のSATD検出ツールと,オープンソースおよびプロプライエタリなLCMを比較した。
既存のツールの中で、MATは適度なリコールがあるにもかかわらず、最高のパフォーマンスを発揮した。
驚いたことに、オープンソースのLLMとプロプライエタリなLLMはどちらも検出精度が低かった。
これらの結果は、既存のアプローチやLLMがテストコード中のSATDを確実に検出できないことを示している。
全体として、この研究は、テストコードにおけるSATDの大規模な解析、その型に関する微妙な理解、および現在のSATD検出方法の限界を初めて提供する。
本研究は,テストコード固有のSATDに関する今後の研究の基盤となるものである。
関連論文リスト
- Understanding Self-Admitted Technical Debt in Test Code: An Empirical Study [2.1295493440485513]
開発者は、コードコメントで技術的負債を明示的に文書化しており、Set-Admitted Technical Debt (SATD)と呼ばれる。
本研究の目的は,テストコードにおけるSATDの性質を明らかにすることである。
また,テストコード中のSATDタイプを包括的に分類し,SATDコメントを自動的に分類する機械学習モデルを開発した。
論文 参考訳(メタデータ) (2025-10-25T11:00:48Z) - Descriptor: C++ Self-Admitted Technical Debt Dataset (CppSATD) [4.114847619719728]
自己申告技術的負債(SATD)は技術的負債(TD)のサブタイプである
SATDに関するこれまでの研究は、主にJavaプログラミング言語に焦点を当ててきた。
531,000以上の注釈付きコメントとそのソースコードコンテキストからなる専用C++ SATDデータセットであるCppSATDを紹介する。
論文 参考訳(メタデータ) (2025-05-02T09:25:41Z) - Studying the Impact of Early Test Termination Due to Assertion Failure on Code Coverage and Spectrum-based Fault Localization [48.22524837906857]
本研究は,アサーション障害による早期検査終了に関する最初の実証的研究である。
6つのオープンソースプロジェクトの207バージョンを調査した。
以上の結果から,早期検査終了は,コードカバレッジとスペクトルに基づく障害局所化の有効性の両方を損なうことが示唆された。
論文 参考訳(メタデータ) (2025-04-06T17:14:09Z) - SAT: Dynamic Spatial Aptitude Training for Multimodal Language Models [78.06537464850538]
シミュレーションは,実画像に翻訳する空間的適性を与えるのに驚くほど効果的であることを示す。
シミュレーションにおける完全アノテーションは、擬似アノテーション実画像の既存のアプローチよりも効果的であることを示す。
論文 参考訳(メタデータ) (2024-12-10T18:52:45Z) - Deep Learning and Data Augmentation for Detecting Self-Admitted Technical Debt [6.004718679054704]
Self-Admitted Technical Debt (SATD)は、開発者がテキストアーティファクトを使用して、既存の実装が最適でない理由を説明する状況を指す。
SATD と BERT のバイナリ識別に BiLSTM アーキテクチャを用い,様々な SATD の分類を行った。
異なるアーティファクトから派生した様々なデータセットからSATDを識別・分類するための2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-21T09:22:16Z) - Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化は機械学習アプリケーションにおいて重要な要素である。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、11タスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も効果的なアプローチを特定した。
論文 参考訳(メタデータ) (2024-06-21T20:06:31Z) - Zero-Shot Detection of Machine-Generated Codes [83.0342513054389]
本研究は,LLMの生成したコードを検出するためのトレーニング不要な手法を提案する。
既存のトレーニングベースまたはゼロショットテキスト検出装置は、コード検出に効果がないことがわかった。
本手法は,リビジョン攻撃に対する堅牢性を示し,Javaコードによく適応する。
論文 参考訳(メタデータ) (2023-10-08T10:08:21Z) - PENTACET data -- 23 Million Contextual Code Comments and 250,000 SATD
comments [3.6095388702618414]
SATD(Self-Admitted Technical Debt)研究の多くは、SATD検出に「TODO」や「FIXME」のような明示的なSATD特徴を用いる。
この作業は、PENTACET(あるいは5Cデータセット)データを通じて、このギャップに対処する。
結果は2300万のコードコメント、各コメントのソースコードコンテキストの前と後、そしてSATDとラベル付けされた25万以上のコメントからなるデータセットである。
論文 参考訳(メタデータ) (2023-03-24T14:42:42Z) - Estimating the hardness of SAT encodings for Logical Equivalence
Checking of Boolean circuits [58.83758257568434]
LEC インスタンスの SAT 符号化の硬さは SAT パーティショニングでは textitw.r. と推定できることを示す。
そこで本研究では, SAT符号化の難易度を精度良く推定できるパーティショニング法を提案する。
論文 参考訳(メタデータ) (2022-10-04T09:19:13Z) - Comprehensible Counterfactual Explanation on Kolmogorov-Smirnov Test [56.5373227424117]
我々は,KSテストに失敗するテストデータに対して,反実的説明を生成する問題に対処する。
我々は、KSテストに失敗したテストセットの指数的なサブセット数を列挙し、チェックするのを避ける効率的なアルゴリズムMOCHEを開発した。
論文 参考訳(メタデータ) (2020-11-01T06:46:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。