論文の概要: Automated Approaches to Detect Self-Admitted Technical Debt: A
Systematic Literature Review
- arxiv url: http://arxiv.org/abs/2312.15020v2
- Date: Tue, 12 Mar 2024 07:12:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 01:05:38.292407
- Title: Automated Approaches to Detect Self-Admitted Technical Debt: A
Systematic Literature Review
- Title(参考訳): 自己充足型技術的負債の自動検出 : 体系的文献レビュー
- Authors: Edi Sutoyo, Andrea Capiluppi
- Abstract要約: 自己承認型技術的負債(SATD)とは、開発者が最適なコード品質や設計上の欠陥を明確に認識するインスタンスを指す。
本稿では,技術的負債検出に使用される特徴抽出手法とML/DLアルゴリズムの分類法を提案する。
- 参考スコア(独自算出の注目度): 6.699060157800401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Technical debt is a pervasive issue in software development, often arising
from trade-offs made during development, which can impede software
maintainability and hinder future development efforts. Self-admitted technical
debt (SATD) refers to instances where developers explicitly acknowledge
suboptimal code quality or design flaws in the codebase. Automated detection of
SATD has emerged as a critical area of research, aiming to assist developers in
identifying and addressing technical debt efficiently. However, the enormous
variety of feature extraction approaches of NLP and algorithms employed in the
literature often hinder researchers from trying to improve their performance.
In light of this, this systematic literature review proposes a taxonomy of
feature extraction techniques and ML/DL algorithms used in technical debt
detection: its objective is to compare and benchmark their performance in the
examined studies. We selected 53 articles that passed the quality evaluation of
the systematic review. We then investigated in depth which feature extractions
and algorithms were employed to identify technical debt in each software
development activity. All approaches proposed in the analyzed studies were
grouped into NLP, NLP+ML, and NLP+DL. This allows us to discuss the performance
in three different ways. Overall, NLP+DL group consistently outperforms in
precision and F1-score for all projects, and in all but one project for the
recall metric. Regarding the feature extraction techniques, the PTE
consistently achieves higher precision, recall, and F1-score for each project
analyzed. Furthermore, TD types have been mappep to software development
activities; this served to determine the best-performing feature extractions
and algorithms for each development activity. Finally, based on the review
results, we also identify implications that could be of concern to researchers
and practitioners.
- Abstract(参考訳): 技術的負債はソフトウェア開発における広範囲にわたる問題であり、しばしば開発中のトレードオフから生じ、ソフトウェアの保守性を阻害し、将来の開発作業を妨げる可能性がある。
SATD(Self-admitted Technical debt)とは、開発者がコードベースのコード品質や設計上の欠陥を明確に認識するインスタンスを指す。
SATDの自動検出は、開発者の技術的負債の特定と対処を支援することを目的として、研究の重要領域として浮上している。
しかし、NLPの多種多様な特徴抽出アプローチや文献で採用されているアルゴリズムは、研究者が性能向上を試みることを妨げていることが多い。
これを踏まえて,本体系的文献レビューでは,技術的負債検出に使用される特徴抽出手法とml/dlアルゴリズムの分類法を提案する。
システムレビューの品質評価に合格した53項目を選択した。
次に,各ソフトウェア開発活動における技術的負債を特定するために,どの特徴抽出とアルゴリズムを用いているかを深く検討した。
分析の結果,NLP,NLP+ML,NLP+DLに分類した。
これにより、パフォーマンスを3つの異なる方法で議論することができます。
全体として、nlp+dlグループは、すべてのプロジェクト、およびリコールメトリックのための1つのプロジェクトを除いて、一貫して精度とf1-scoreで優れています。
特徴抽出技術に関して、PTEは解析された各プロジェクトに対して高い精度、リコール、F1スコアを達成する。
さらに、TDタイプはソフトウェア開発活動にマッピングされており、各開発活動の最も優れた特徴抽出とアルゴリズムを決定するのに役立っている。
最後に,レビュー結果に基づいて,研究者や実践者にとって懸念すべき点を明らかにする。
関連論文リスト
- SIaM: Self-Improving Code-Assisted Mathematical Reasoning of Large Language Models [54.78329741186446]
本稿では,コードに基づく批判モデルを用いて,質問コードデータ構築,品質管理,補完的評価などのステップをガイドする新しいパラダイムを提案する。
英語と中国語におけるドメイン内ベンチマークとドメイン外ベンチマークの両方の実験は、提案したパラダイムの有効性を実証している。
論文 参考訳(メタデータ) (2024-08-28T06:33:03Z) - MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z) - State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.279784235147254]
このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。
新たなイメージは、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを考える余地があることを示唆している。
論文 参考訳(メタデータ) (2024-06-13T12:51:22Z) - A Novel Generative AI-Based Framework for Anomaly Detection in Multicast Messages in Smart Grid Communications [0.0]
デジタル変電所におけるサイバーセキュリティ侵害は、電力系統の運用の安定性と信頼性に重大な課題をもたらす。
本稿では,マルチキャストメッセージのデータセットにおける異常検出(AD)のためのタスク指向対話システムを提案する。
潜在的なエラーが低く、人間の推奨するサイバーセキュリティガイドラインを考えるプロセスよりもスケーラビリティと適応性が向上します。
論文 参考訳(メタデータ) (2024-06-08T13:28:50Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Uncertainty Estimation of Transformers' Predictions via Topological Analysis of the Attention Matrices [3.1466086042810884]
トランスフォーマーベースの言語モデルは、幅広いNLPタスクに新しいベンチマークを設定している。
予測の不確実性を確実に見積もるのは 重要な課題です
モデル信頼度を評価するために,複数の頭部・層にまたがるアテンションマップの幾何学的特徴を活用することで,これらの制約に対処する。
提案手法は,アクセプタビリティ判定と人工テキスト検出のためのベンチマークにおいて,既存の不確実性推定手法を著しく上回っている。
論文 参考訳(メタデータ) (2023-08-22T09:17:45Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Deep Transfer Learning for Automatic Speech Recognition: Towards Better
Generalization [3.6393183544320236]
深層学習(DL)における音声認識の課題
大規模なトレーニングデータセットと高い計算とストレージリソースが必要です。
ディープトランスファーラーニング(DTL)はこれらの問題を克服するために導入された。
論文 参考訳(メタデータ) (2023-04-27T21:08:05Z) - Measuring Improvement of F$_1$-Scores in Detection of Self-Admitted
Technical Debt [5.750379648650073]
変換器(BERT)アーキテクチャからの双方向表現を利用した新しいアプローチによりSATDの検出を改善する。
トレーニングされたBERTモデルは、プロジェクト横断シナリオにおいて、20プロジェクト中19プロジェクトにおいて、以前のすべてのメソッドの最高のパフォーマンスよりも改善されていることが分かりました。
今後の研究では、SATDデータセットを多様化して、大きなBERTモデルの潜伏電力を最大化する方法について検討する予定である。
論文 参考訳(メタデータ) (2023-03-16T19:47:38Z) - On the Reliability and Explainability of Language Models for Program
Generation [15.569926313298337]
自動プログラム生成手法の能力と限界について検討する。
私たちは、コード変換に大きく貢献するトークンを強調するために、高度な説明可能なAIアプローチを採用しています。
解析の結果,言語モデルではコード文法や構造情報を認識できるが,入力シーケンスの変化に対するロバスト性は限られていることがわかった。
論文 参考訳(メタデータ) (2023-02-19T14:59:52Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。