論文の概要: Detection of Technical Debt in Java Source Code
- arxiv url: http://arxiv.org/abs/2411.05457v2
- Date: Sat, 09 Aug 2025 09:45:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 16:55:51.256824
- Title: Detection of Technical Debt in Java Source Code
- Title(参考訳): Javaソースコードにおける技術的負債の検出
- Authors: Nam Le Hai, Anh M. T. Bui, Phuong T. Nguyen, Davide Di Ruscio, Rick Kazman,
- Abstract要約: 技術的負債(TD)は、開発者が問題に対して迅速かつ簡単な解決策を選択すると生じる追加コストを記述します。
本研究では、974のJavaプロジェクトからのコメントとそのソースコードの分析を通じて、コードコメントによって識別された最初のTDデータセットをキュレートした。
- 参考スコア(独自算出の注目度): 12.07607688189035
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Technical debt (TD) describes the additional costs that emerge when developers have opted for a quick and easy solution to a problem, rather than a more effective and well-designed, but time-consuming approach. Self-Admitted Technical Debts (SATDs) are a specific type of technical debts that developers intentionally document and acknowledge, typically via textual comments. While these comments are a useful tool for identifying TD, most of the existing approaches focus on capturing tokens associated with various categories of TD, neglecting the rich information embedded within the source code. Recent research has focused on detecting SATDs by analyzing comments, and there has been little work dealing with TD contained in the source code. In this study, through the analysis of comments and their source code from 974 Java projects, we curated the first ever dataset of TD identified by code comments, coupled with its code. We found that including the classified code significantly improves the accuracy in predicting various types of technical debt. We believe that our dataset will catalyze future work in the domain, inspiring various research related to the recognition of technical debt; The proposed classifiers may serve as baselines for studies on the detection of TD.
- Abstract(参考訳): 技術的負債(TD)は、開発者がより効率的でよく設計されたが時間を要するアプローチではなく、問題に対する迅速で簡単なソリューションを選択した時に生じる追加コストを記述します。
自己承認技術的負債(英: Self-Admitted Technical Debts、SATD)は、開発者が意図的に文書化して認識する特定の技術的負債の一種である。
これらのコメントはTDを特定するのに役立つツールであるが、既存のアプローチのほとんどは、ソースコードに埋め込まれた豊富な情報を無視して、TDのさまざまなカテゴリに関連するトークンをキャプチャすることに焦点を当てている。
最近の研究は、コメントを分析してSATDを検出することに重点を置いており、ソースコードに含まれるTDを扱う作業はほとんど行われていない。
本研究では、974のJavaプロジェクトからのコメントとそのソースコードの分析を通じて、コードコメントによって識別された最初のTDデータセットとコードの組み合わせをキュレートした。
分類コードを含めると,様々な技術的負債の予測精度が大幅に向上することがわかった。
提案する分類器は,TD検出研究のベースラインとなる可能性がある。
関連論文リスト
- DATABench: Evaluating Dataset Auditing in Deep Learning from an Adversarial Perspective [59.66984417026933]
内的特徴(IF)と外的特徴(EF)(監査のための技術導入)に依存した既存手法の分類を新たに導入する。
回避攻撃(evasion attack)は、データセットの使用を隠蔽するために設計されたもので、偽造攻撃(forgery attack)は、未使用のデータセットを誤って含んでいることを意図している。
さらに,既存手法の理解と攻撃目標に基づいて,回避のための分離・除去・検出,偽造の逆例に基づく攻撃方法など,系統的な攻撃戦略を提案する。
私たちのベンチマークであるData dataBenchは、17の回避攻撃、5の偽攻撃、9の攻撃で構成されています。
論文 参考訳(メタデータ) (2025-07-08T03:07:15Z) - Descriptor: C++ Self-Admitted Technical Debt Dataset (CppSATD) [4.114847619719728]
自己申告技術的負債(SATD)は技術的負債(TD)のサブタイプである
SATDに関するこれまでの研究は、主にJavaプログラミング言語に焦点を当ててきた。
531,000以上の注釈付きコメントとそのソースコードコンテキストからなる専用C++ SATDデータセットであるCppSATDを紹介する。
論文 参考訳(メタデータ) (2025-05-02T09:25:41Z) - An Empirical Study on the Effectiveness of Large Language Models for Binary Code Understanding [50.17907898478795]
本研究では,現実のリバースエンジニアリングシナリオにおけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。
評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文 参考訳(メタデータ) (2025-04-30T17:02:06Z) - Knowledge Graph Completion with Relation-Aware Anchor Enhancement [50.50944396454757]
関係認識型アンカー強化知識グラフ補完法(RAA-KGC)を提案する。
まず、ヘッダーのリレーショナル・アウェア・エリア内でアンカー・エンティティを生成します。
次に、アンカーの近傍に埋め込まれたクエリを引っ張ることで、ターゲットのエンティティマッチングに対してより差別的になるように調整する。
論文 参考訳(メタデータ) (2025-04-08T15:22:08Z) - Leveraging multi-task learning to improve the detection of SATD and vulnerability [2.5385600700122737]
Self-Admitted Technical Debt (SATD) は、短期的なニーズのために導入された、不公平でないコードを示すコード内のコメントである。
VulSATDは、CodeBERTに基づいた脆弱性とSATDコードを検出するディープラーニングである。
論文 参考訳(メタデータ) (2025-01-27T10:31:07Z) - GeAR: Generation Augmented Retrieval [82.20696567697016]
文書検索技術は大規模情報システム開発の基礎となる。
一般的な手法は、バイエンコーダを構築し、セマンティックな類似性を計算することである。
我々は、よく設計された融合およびデコードモジュールを組み込んだ $textbfGe$neration という新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-06T05:29:00Z) - SIaM: Self-Improving Code-Assisted Mathematical Reasoning of Large Language Models [54.78329741186446]
本稿では,コードに基づく批判モデルを用いて,質問コードデータ構築,品質管理,補完的評価などのステップをガイドする新しいパラダイムを提案する。
英語と中国語におけるドメイン内ベンチマークとドメイン外ベンチマークの両方の実験は、提案したパラダイムの有効性を実証している。
論文 参考訳(メタデータ) (2024-08-28T06:33:03Z) - MADE-WIC: Multiple Annotated Datasets for Exploring Weaknesses In Code [2.399010142304227]
MADE-WICは、機能とコメントの大規模なデータセットであり、技術的負債とコードの弱点に対する複数のアノテーションがある。
約860Kのコード関数と、12のオープンソースプロジェクトからの2.7M以上の関連コメントが含まれている。
論文 参考訳(メタデータ) (2024-08-09T16:32:38Z) - CoIR: A Comprehensive Benchmark for Code Information Retrieval Models [56.691926887209895]
textbfInformation textbfRetrieval Benchmark(textbfInformation textbfRetrieval Benchmark)は,コード検索機能の評価に特化して設計された,堅牢で包括的なベンチマークである。
名前は、Textbftenを巧みにキュレートしたコードデータセットから成り、textbfs7の異なるドメインにまたがる、textbfeight特有の検索タスクにまたがる。
我々は9つの広く使われている検索モデルを名前を用いて評価し、最先端のシステムであってもコード検索タスクの実行に重大な困難を見出した。
論文 参考訳(メタデータ) (2024-07-03T07:58:20Z) - Systematic literature review on forecasting and prediction of technical debt evolution [0.0]
技術的負債(英: Technical debt、TD)とは、ソフトウェア品質の妥協によって生じる追加コストのこと。
本研究の目的は,ソフトウェア工学における既存の知識を探求し,研究と産業におけるアプローチの洞察を得ることである。
論文 参考訳(メタデータ) (2024-06-17T18:50:37Z) - A Comprehensive Survey on Underwater Image Enhancement Based on Deep Learning [51.7818820745221]
水中画像強調(UIE)はコンピュータビジョン研究において重要な課題である。
多数のUIEアルゴリズムが開発されているにもかかわらず、網羅的で体系的なレビューはいまだに欠落している。
論文 参考訳(メタデータ) (2024-05-30T04:46:40Z) - SATDAUG -- A Balanced and Augmented Dataset for Detecting Self-Admitted
Technical Debt [6.699060157800401]
自己承認技術的負債(Self-admitted Technical debt、SATD)とは、開発者が技術的ショートカットの存在を明確に認識し、文書化する技術的負債の一種である。
textitSATDAUGデータセットは、ソースコードコメント、イシュートラッカ、プルリクエスト、コミットメッセージを含む既存のSATDデータセットの拡張バージョンです。
論文 参考訳(メタデータ) (2024-03-12T14:33:53Z) - What Can Self-Admitted Technical Debt Tell Us About Security? A
Mixed-Methods Study [6.286506087629511]
自己充足型技術的負債(SATD)
潜在的に悪用可能な脆弱性や セキュリティ上の欠陥に関する 恐ろしい情報源と見なすことができます
本研究は、SATDのセキュリティへの影響を、技術と開発者中心の観点から検討する。
論文 参考訳(メタデータ) (2024-01-23T13:48:49Z) - Utilization of machine learning for the detection of self-admitted
vulnerabilities [0.0]
技術的負債(Technical debt)とは、短期的なニーズのために導入された、不公平なコードを記述するメタファーである。
開発者はそれを意識し、ソースコードのコメントで認めている。
論文 参考訳(メタデータ) (2023-09-27T12:38:12Z) - SF-FSDA: Source-Free Few-Shot Domain Adaptive Object Detection with
Efficient Labeled Data Factory [94.11898696478683]
ドメイン適応オブジェクト検出は、ラベル付きソースドメインから学んだ知識を活用し、ラベルなしのターゲットドメインのパフォーマンスを改善することを目的としています。
本研究では,SF-FSDA という名称のソースフリーおよび少数ショット条件下で,より実用的で困難な領域適応型オブジェクト検出問題を提案し,検討する。
論文 参考訳(メタデータ) (2023-06-07T12:34:55Z) - A Continual Deepfake Detection Benchmark: Dataset, Methods, and
Essentials [97.69553832500547]
本稿では, 既知の生成モデルと未知の生成モデルの両方から, 新たなディープフェイク集合に対する連続的なディープフェイク検出ベンチマーク(CDDB)を提案する。
本研究では,連続的なディープラーニング検出問題に対して,連続的な視覚認識で一般的に使用される多クラス漸進学習手法を適応するために,複数のアプローチを利用する。
論文 参考訳(メタデータ) (2022-05-11T13:07:19Z) - A Transformer-based Approach for Source Code Summarization [86.08359401867577]
コードトークン間のペア関係をモデル化することにより,要約のためのコード表現を学習する。
アプローチは単純であるにもかかわらず、最先端技術よりもかなりの差があることが示される。
論文 参考訳(メタデータ) (2020-05-01T23:29:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。