論文の概要: Understanding Self-Admitted Technical Debt in Test Code: An Empirical Study
- arxiv url: http://arxiv.org/abs/2510.22249v1
- Date: Sat, 25 Oct 2025 11:00:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 15:28:14.998996
- Title: Understanding Self-Admitted Technical Debt in Test Code: An Empirical Study
- Title(参考訳): テストコードにおける自己充足型技術的負債の理解--実証的研究
- Authors: Ibuki Nakamura, Yutaro Kashiwa, Bin Lin, Hajimu Iida,
- Abstract要約: 開発者は、コードコメントで技術的負債を明示的に文書化しており、Set-Admitted Technical Debt (SATD)と呼ばれる。
本研究の目的は,テストコードにおけるSATDの性質を明らかにすることである。
また,テストコード中のSATDタイプを包括的に分類し,SATDコメントを自動的に分類する機械学習モデルを開発した。
- 参考スコア(独自算出の注目度): 2.1295493440485513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developers often opt for easier but non-optimal implementation to meet deadlines or create rapid prototypes, leading to additional effort known as technical debt to improve the code later. Oftentimes, developers explicitly document the technical debt in code comments, referred to as Self-Admitted Technical Debt (SATD). Numerous researchers have investigated the impact of SATD on different aspects of software quality and development processes. However, most of these studies focus on SATD in production code, often overlooking SATD in the test code or assuming that it shares similar characteristics with SATD in production code. In fact, a significant amount of SATD is also present in the test code, with many instances not fitting into existing categories for the production code. This study aims to fill this gap and disclose the nature of SATD in the test code by examining its distribution and types. Moreover, the relation between its presence and test quality is also analyzed. Our empirical study, involving 17,766 SATD comments (14,987 from production code, 2,779 from test code) collected from 50 repositories, demonstrates that while SATD widely exists in test code, it is not directly associated with test smells. Our study also presents comprehensive categories of SATD types in the test code, and machine learning models are developed to automatically classify SATD comments based on their types for easier management. Our results show that the CodeBERT-based model outperforms other machine learning models in terms of recall and F1-score. However, the performance varies on different types of SATD.
- Abstract(参考訳): 開発者はしばしば、期限を満たしたり、迅速なプロトタイプを作成するために、簡単だが最適でない実装を選択する。
多くの場合、開発者はコードコメントで技術的負債を明示的に文書化しており、それは「Self-Admitted Technical Debt (SATD)」と呼ばれている。
多くの研究者がSATDがソフトウェアの品質と開発プロセスの異なる側面に与える影響を調査している。
しかし、これらの研究の多くは実運用コードでのSATDに焦点を当てており、しばしばテストコードでSATDを見落としたり、実運用コードでSATDと類似した特性を共有していると仮定する。
実際、SATDのかなりの量がテストコードに存在し、多くのインスタンスが運用コードの既存のカテゴリに適合しない。
本研究では、このギャップを埋め、その分布と型を調べて、テストコードにおけるSATDの性質を明らかにすることを目的とする。
また、その存在とテスト品質との関係も分析した。
50リポジトリから収集した17,766件のSATDコメント(実運用コード14,987件,テストコード2,779件)による実証研究により,SATDはテストコードに広く存在するが,テスト臭いに直接関連しないことが示された。
また,テストコード内のSATDタイプを包括的に分類し,それらのタイプに基づいてSATDコメントを自動的に分類し,管理を容易にする機械学習モデルを開発した。
以上の結果から,CodeBERTベースのモデルは,リコールやF1スコアの点で,他の機械学習モデルよりも優れていることがわかった。
しかし、その性能はSATDの種類によって異なる。
関連論文リスト
- A First Look at the Self-Admitted Technical Debt in Test Code: Taxonomy and Detection [7.475625941772781]
自己承認技術的負債(Self-admitted Technical debt,SATD)とは、開発者がコードの問題や回避策、あるいは準最適ソリューションを明確に認めるコメントのことである。
本研究では,1000のオープンソースJavaプロジェクトを対象に,160万件のコメントからランダムに5万件のコメントをランダムに分析することにより,SATDをテストコードで解析する。
論文 参考訳(メタデータ) (2025-10-25T19:09:18Z) - Alignment with Fill-In-the-Middle for Enhancing Code Generation [56.791415642365415]
コードスニペットを小さな粒度のブロックに分割し,同じテストケースからより多様なDPOペアを生成する手法を提案する。
提案手法は,HumanEval (+), MBPP (+), APPS, LiveCodeBench, BigCodeBenchといったベンチマークデータセットの実験によって検証された,コード生成タスクの大幅な改善を示す。
論文 参考訳(メタデータ) (2025-08-27T03:15:53Z) - KodCode: A Diverse, Challenging, and Verifiable Synthetic Dataset for Coding [49.56049319037421]
KodCodeは、高品質で検証可能なトレーニングデータを取得するという永続的な課題に対処する、合成データセットである。
自己検証手順によって体系的に検証される質問解決テスト三つ子を含む。
このパイプラインは大規模で堅牢で多様なコーディングデータセットを生成する。
論文 参考訳(メタデータ) (2025-03-04T19:17:36Z) - Evidence is All We Need: Do Self-Admitted Technical Debts Impact Method-Level Maintenance? [1.0377683220196874]
Self-Admitted Technical Debt (SATD)は、開発者がソースコードのコメントを通じて技術的負債を明示的に認める現象である。
本稿では,SATDがソフトウェア保守の様々な面に与える影響を,方法論レベルで実証的に検討することを目的とする。
論文 参考訳(メタデータ) (2024-11-21T01:21:35Z) - Deep Learning and Data Augmentation for Detecting Self-Admitted Technical Debt [6.004718679054704]
Self-Admitted Technical Debt (SATD)は、開発者がテキストアーティファクトを使用して、既存の実装が最適でない理由を説明する状況を指す。
SATD と BERT のバイナリ識別に BiLSTM アーキテクチャを用い,様々な SATD の分類を行った。
異なるアーティファクトから派生した様々なデータセットからSATDを識別・分類するための2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-21T09:22:16Z) - An Exploratory Study of the Relationship between SATD and Other Software Development Activities [13.026170714454071]
Self-Admitted Technical Debt (SATD)は、開発者が負債を思い出させるためにコードをドキュメント化する、特定のタイプのTechnical Debtである。
これまでの研究では、SATDの様々な側面を探求してきた。
本研究ではSATDの削除と追加とバグ修正,新機能の追加,テストなどの活動との関係について検討する。
論文 参考訳(メタデータ) (2024-04-02T13:45:42Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - Estimating the hardness of SAT encodings for Logical Equivalence
Checking of Boolean circuits [58.83758257568434]
LEC インスタンスの SAT 符号化の硬さは SAT パーティショニングでは textitw.r. と推定できることを示す。
そこで本研究では, SAT符号化の難易度を精度良く推定できるパーティショニング法を提案する。
論文 参考訳(メタデータ) (2022-10-04T09:19:13Z) - CodeT: Code Generation with Generated Tests [49.622590050797236]
テストケースを自動的に生成するための事前学習言語モデルについて検討する。
CodeTは生成されたテストケースを使ってコードソリューションを実行し、次に最良のソリューションを選択します。
我々は,HumanEvalとMBPPのベンチマークを用いて,5種類の事前学習モデル上でCodeTを評価する。
論文 参考訳(メタデータ) (2022-07-21T10:18:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。