論文の概要: Detecting Technical Debt Using Natural Language Processing Approaches --
A Systematic Literature Review
- arxiv url: http://arxiv.org/abs/2312.15020v1
- Date: Tue, 19 Dec 2023 12:01:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-31 03:15:47.206627
- Title: Detecting Technical Debt Using Natural Language Processing Approaches --
A Systematic Literature Review
- Title(参考訳): 自然言語処理による技術的負債の検出 -体系的文献レビュー-
- Authors: Edi Sutoyo, Andrea Capiluppi
- Abstract要約: 技術的負債(Technical debt、TD)は、ソフトウェア開発におけるアーキテクチャ決定の長期的な影響のメタファーとしてよく知られている。
本稿では,技術的負債検出に使用される特徴抽出手法とアルゴリズムの分類法を提案する。
- 参考スコア(独自算出の注目度): 6.699060157800401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Context: Technical debt (TD) is a well-known metaphor for the long-term
effects of architectural decisions in software development and the trade-off
between producing high-quality, effective, and efficient code and meeting a
release schedule. Thus, the code degrades and needs refactoring. A lack of
resources, time, knowledge, or experience on the development team might cause
TD in any software development project. Objective: In the context of TD
detection, NLP has been utilized to identify the presence of TD automatically
and even recognize specific types of TD. However, the enormous variety of
feature extraction approaches and ML/DL algorithms employed in the literature
often hinders researchers from trying to improve their performance. Method: In
light of this, this SLR proposes a taxonomy of feature extraction techniques
and algorithms used in technical debt detection: its objective is to compare
and benchmark their performance in the examined studies. Results: We selected
55 articles that passed the quality evaluation of this SLR. We then
investigated which feature extractions and algorithms were employed to identify
TD in each SDLC phase. All approaches proposed in the analyzed studies were
grouped into NLP, NLP+ML, and NLP+DL. This allows us to discuss the performance
in three different ways. Conclusion: Overall, the NLP+DL group consistently
outperforms in precision and F1-score for all projects, and in all but one
project for the recall metric. Regarding the feature extraction techniques, the
PTWE consistently achieves higher precision, recall, and F1-score for each
project analyzed. Furthermore, TD types have been mapped, when possible, to
SDLC phases: this served to determine the best-performing feature extractions
and algorithms for each SDLC phase. Finally, based on the SLR results, we also
identify implications that could be of concern to researchers and
practitioners.
- Abstract(参考訳): コンテキスト: 技術的負債(TD)は、ソフトウェア開発におけるアーキテクチャ決定の長期的影響と、高品質で効果的で効率的なコードの作成とリリーススケジュールの達成の間のトレードオフのメタファーとしてよく知られている。
したがって、コードは劣化し、リファクタリングが必要です。
開発チームにおけるリソース、時間、知識、経験の欠如は、あらゆるソフトウェア開発プロジェクトでTDを引き起こす可能性がある。
目的: TD検出の文脈では、NLPは自動的にTDの存在を識別し、特定のタイプのTDを認識する。
しかし、この文献で採用されている多種多様な特徴抽出手法とML/DLアルゴリズムは、研究者が性能改善を試みるのを妨げることが多い。
方法:これを踏まえて,このslrでは,技術的負債検出に使用される特徴抽出手法とアルゴリズムの分類を提案している。
結果: このSLRの品質評価に合格した55項目を選択した。
SDLCの各位相におけるTDの同定に,どの特徴抽出とアルゴリズムを用いたかを検討した。
分析の結果,NLP,NLP+ML,NLP+DLに分類した。
これにより、パフォーマンスを3つの異なる方法で議論することができます。
結論: 総じて, NLP+DL群は, 全プロジェクトにおいて, 精度とF1スコアにおいて, かつリコール基準において, 1つのプロジェクトを除いて, 一貫して優れていた。
特徴抽出技術に関して、PTWEは解析された各プロジェクトに対して高い精度、リコール、F1スコアを達成する。
さらに、td型は可能であればsdlcフェーズにマッピングされ、sdlcフェーズごとに最も優れた特徴抽出とアルゴリズムを決定するのに役立った。
最後に、SLRの結果に基づいて、研究者や実践者にとって関心のある意味も特定する。
関連論文リスト
- What Really Matters for Learning-based LiDAR-Camera Calibration [50.2608502974106]
本稿では,学習に基づくLiDAR-Cameraキャリブレーションの開発を再考する。
我々は、広く使われているデータ生成パイプラインによる回帰ベースの手法の限界を識別する。
また,入力データ形式と前処理操作がネットワーク性能に与える影響についても検討する。
論文 参考訳(メタデータ) (2025-01-28T14:12:32Z) - Leveraging Conversational Generative AI for Anomaly Detection in Digital Substations [0.0]
提案したADフレームワークとHITLベースのADフレームワークの比較評価を行うために,高度なパフォーマンス指標を採用している。
このアプローチは、サイバーセキュリティの課題が進展する中で、電力系統運用の信頼性を高めるための有望なソリューションを提供する。
論文 参考訳(メタデータ) (2024-11-09T18:38:35Z) - SIaM: Self-Improving Code-Assisted Mathematical Reasoning of Large Language Models [54.78329741186446]
本稿では,コードに基づく批判モデルを用いて,質問コードデータ構築,品質管理,補完的評価などのステップをガイドする新しいパラダイムを提案する。
英語と中国語におけるドメイン内ベンチマークとドメイン外ベンチマークの両方の実験は、提案したパラダイムの有効性を実証している。
論文 参考訳(メタデータ) (2024-08-28T06:33:03Z) - MR-Ben: A Meta-Reasoning Benchmark for Evaluating System-2 Thinking in LLMs [55.20845457594977]
大規模言語モデル(LLM)は、問題解決と意思決定の能力の向上を示している。
本稿ではメタ推論技術を必要とするプロセスベースのベンチマークMR-Benを提案する。
メタ推論のパラダイムは,システム2のスロー思考に特に適しています。
論文 参考訳(メタデータ) (2024-06-20T03:50:23Z) - A Novel Generative AI-Based Framework for Anomaly Detection in Multicast Messages in Smart Grid Communications [0.0]
デジタル変電所におけるサイバーセキュリティ侵害は、電力系統の運用の安定性と信頼性に重大な課題をもたらす。
本稿では,マルチキャストメッセージのデータセットにおける異常検出(AD)のためのタスク指向対話システムを提案する。
潜在的なエラーが低く、人間の推奨するサイバーセキュリティガイドラインを考えるプロセスよりもスケーラビリティと適応性が向上します。
論文 参考訳(メタデータ) (2024-06-08T13:28:50Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Uncertainty Estimation of Transformers' Predictions via Topological Analysis of the Attention Matrices [3.1466086042810884]
トランスフォーマーベースの言語モデルは、幅広いNLPタスクに新しいベンチマークを設定している。
予測の不確実性を確実に見積もるのは 重要な課題です
モデル信頼度を評価するために,複数の頭部・層にまたがるアテンションマップの幾何学的特徴を活用することで,これらの制約に対処する。
提案手法は,アクセプタビリティ判定と人工テキスト検出のためのベンチマークにおいて,既存の不確実性推定手法を著しく上回っている。
論文 参考訳(メタデータ) (2023-08-22T09:17:45Z) - The Devil is in the Errors: Leveraging Large Language Models for
Fine-grained Machine Translation Evaluation [93.01964988474755]
AutoMQMは,大規模な言語モデルに対して,翻訳におけるエラーの識別と分類を求めるプロンプト技術である。
テキスト内学習と微調整によるラベル付きデータの影響について検討する。
次に, PaLM-2モデルを用いてAutoMQMを評価し, スコアのプロンプトよりも性能が向上することがわかった。
論文 参考訳(メタデータ) (2023-08-14T17:17:21Z) - Deep Transfer Learning for Automatic Speech Recognition: Towards Better
Generalization [3.6393183544320236]
深層学習(DL)における音声認識の課題
大規模なトレーニングデータセットと高い計算とストレージリソースが必要です。
ディープトランスファーラーニング(DTL)はこれらの問題を克服するために導入された。
論文 参考訳(メタデータ) (2023-04-27T21:08:05Z) - On the Reliability and Explainability of Language Models for Program
Generation [15.569926313298337]
自動プログラム生成手法の能力と限界について検討する。
私たちは、コード変換に大きく貢献するトークンを強調するために、高度な説明可能なAIアプローチを採用しています。
解析の結果,言語モデルではコード文法や構造情報を認識できるが,入力シーケンスの変化に対するロバスト性は限られていることがわかった。
論文 参考訳(メタデータ) (2023-02-19T14:59:52Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。