論文の概要: Automatic Identification of Self-Admitted Technical Debt from Four
Different Sources
- arxiv url: http://arxiv.org/abs/2202.02387v5
- Date: Fri, 21 Apr 2023 11:39:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-24 18:39:03.084388
- Title: Automatic Identification of Self-Admitted Technical Debt from Four
Different Sources
- Title(参考訳): 4つの異なるソースからの自己承認技術的負債の自動識別
- Authors: Yikun Li, Mohamed Soliman, Paris Avgeriou
- Abstract要約: 技術的負債とは、ソフトウェアシステムの長期的な保守性と進化性を犠牲にして、短期的な目標を達成するためにショートカットを取ることを指す。
これまでの作業は、ソースコードコメントとイシュートラッカからSATDを識別することに集中していた。
ソースコードコメント,コミットメッセージ,プルリクエスト,イシュートラッキングシステムという4つのソースを統合したSATDの自動識別手法を提案する。
- 参考スコア(独自算出の注目度): 3.446864074238136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Technical debt refers to taking shortcuts to achieve short-term goals while
sacrificing the long-term maintainability and evolvability of software systems.
A large part of technical debt is explicitly reported by the developers
themselves; this is commonly referred to as Self-Admitted Technical Debt or
SATD. Previous work has focused on identifying SATD from source code comments
and issue trackers. However, there are no approaches available for
automatically identifying SATD from other sources such as commit messages and
pull requests, or by combining multiple sources. Therefore, we propose and
evaluate an approach for automated SATD identification that integrates four
sources: source code comments, commit messages, pull requests, and issue
tracking systems. Our findings show that our approach outperforms baseline
approaches and achieves an average F1-score of 0.611 when detecting four types
of SATD (i.e., code/design debt, requirement debt, documentation debt, and test
debt) from the four aforementioned sources. Thereafter, we analyze 23.6M code
comments, 1.3M commit messages, 3.7M issue sections, and 1.7M pull request
sections to characterize SATD in 103 open-source projects. Furthermore, we
investigate the SATD keywords and relations between SATD in different sources.
The findings indicate, among others, that: 1) SATD is evenly spread among all
sources; 2) issues and pull requests are the two most similar sources regarding
the number of shared SATD keywords, followed by commit messages, and then
followed by code comments; 3) there are four kinds of relations between SATD
items in the different sources.
- Abstract(参考訳): 技術的負債とは、ソフトウェアシステムの長期的な保守性と進化性を犠牲にして、短期的な目標を達成するためにショートカットを取ることを指す。
技術的負債の大部分は、開発者自身によって明示的に報告されており、一般的には、セルフコミットメント技術的負債(Self-Admitted Technical Debt、SATD)と呼ばれる。
これまでの作業は、ソースコードコメントとイシュートラッカからSATDを識別することに集中していた。
しかし、コミットメッセージやプルリクエストなどの他のソースからSATDを自動的に識別するアプローチや、複数のソースを組み合わせるアプローチはない。
そこで我々は,ソースコードコメント,コミットメッセージ,プルリクエスト,イシュートラッキングシステムという4つのソースを統合する自動satd識別手法を提案し,評価する。
提案手法は, 4種類のSATD(コード/設計負債, 要件負債, ドキュメント負債, テスト負債)を検出する場合に, ベースラインアプローチより優れ, 平均F1スコアが0.611であることを示す。
その後、23.6mのコードコメント、1.3mコミットメッセージ、3.7m発行セクション、1.7mプルリクエストセクションを分析し、103のオープンソースプロジェクトでsatdを特徴付ける。
さらに,SATD キーワードと SATD の関係について検討した。
この発見は、以下を示唆している。
1)SATDは,すべてのソースに均等に分散する。
2) 問題とプルリクエストは,共有satキーワードの数,コミットメッセージ,コードコメントに関して,最もよく似た2つのソースである。
3)異なるソースにsat項目間の関係は4種類ある。
関連論文リスト
- Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化(英: Uncertainty Quantification、UQ)は、機械学習(ML)アプリケーションにおいて重要なコンポーネントである。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、9つのタスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も有望なアプローチを特定した。
論文 参考訳(メタデータ) (2024-06-21T20:06:31Z) - An Exploratory Study of the Relationship between SATD and Other Software Development Activities [13.026170714454071]
Self-Admitted Technical Debt (SATD)は、開発者が負債を思い出させるためにコードをドキュメント化する、特定のタイプのTechnical Debtである。
これまでの研究では、SATDの様々な側面を探求してきた。
本研究ではSATDの削除と追加とバグ修正,新機能の追加,テストなどの活動との関係について検討する。
論文 参考訳(メタデータ) (2024-04-02T13:45:42Z) - SATDAUG -- A Balanced and Augmented Dataset for Detecting Self-Admitted
Technical Debt [6.699060157800401]
自己承認技術的負債(Self-admitted Technical debt、SATD)とは、開発者が技術的ショートカットの存在を明確に認識し、文書化する技術的負債の一種である。
textitSATDAUGデータセットは、ソースコードコメント、イシュートラッカ、プルリクエスト、コミットメッセージを含む既存のSATDデータセットの拡張バージョンです。
論文 参考訳(メタデータ) (2024-03-12T14:33:53Z) - Evaluating Verifiability in Generative Search Engines [70.59477647085387]
生成検索エンジンは、インラインの引用とともに、ユーザークエリへの応答を直接生成する。
我々は,一般的な4つの生成検索エンジンの評価を行う。
既存の生成検索エンジンからの応答は流動的であり、情報的に見えるが、しばしばサポートされていない文や不正確な引用を含んでいる。
論文 参考訳(メタデータ) (2023-04-19T17:56:12Z) - PENTACET data -- 23 Million Contextual Code Comments and 250,000 SATD
comments [3.6095388702618414]
SATD(Self-Admitted Technical Debt)研究の多くは、SATD検出に「TODO」や「FIXME」のような明示的なSATD特徴を用いる。
この作業は、PENTACET(あるいは5Cデータセット)データを通じて、このギャップに対処する。
結果は2300万のコードコメント、各コメントのソースコードコンテキストの前と後、そしてSATDとラベル付けされた25万以上のコメントからなるデータセットである。
論文 参考訳(メタデータ) (2023-03-24T14:42:42Z) - Automatically Identifying Relations Between Self-Admitted Technical Debt
Across Different Sources [3.446864074238136]
Self-Admitted Technical DebtまたはSATDは、ソースコードコメント、コミットメッセージ、イシュートラッキングシステム、プルリクエストなど、さまざまなソースで見ることができる。
従来の研究は、SATDアイテム間の関係を異なるソースで確立してきた。
異なるソース間でSATD関係を自動的に識別するためのアプローチを提案し,評価する。
論文 参考訳(メタデータ) (2023-03-13T13:03:55Z) - Interleaving Retrieval with Chain-of-Thought Reasoning for
Knowledge-Intensive Multi-Step Questions [50.114651561111245]
マルチステップ質問応答のための新しいアプローチであるIRCoTを提案する。
CoTのステップで検索をインターリーブし、CoTで検索を誘導し、検索結果を用いてCoTを改善する。
論文 参考訳(メタデータ) (2022-12-20T18:26:34Z) - Identifying Self-Admitted Technical Debt in Issue Tracking Systems using
Machine Learning [3.446864074238136]
技術的負債は短期的利益のために実装された準最適ソリューションのメタファーである。
Self-Admitted Technical Debtの特定に関する作業の多くは、ソースコードのコメントに重点を置いている。
本稿では,機械学習を用いた問題追跡システムにおけるSATDの自動識別手法の提案と最適化を行う。
論文 参考訳(メタデータ) (2022-02-04T15:15:13Z) - S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文 参考訳(メタデータ) (2021-03-18T21:10:41Z) - GMOT-40: A Benchmark for Generic Multiple Object Tracking [65.80411267046786]
我々はジェネリック・マルチプル・オブジェクト・トラッキング(GMOT)の研究を3つの側面で促進するために貢献する。
まず、GMOT-40と呼ばれる最初の公開GMOTデータセットを構築する。
第二に、専用追跡アルゴリズムの欠如に留意して、一連のベースラインGMOTアルゴリズムを設計した。
第3に、一般的なMOTアルゴリズムと提案したベースラインを含むGMOT-40の徹底的な評価を行う。
論文 参考訳(メタデータ) (2020-11-24T02:51:46Z) - Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。
ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。
我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文 参考訳(メタデータ) (2020-10-20T16:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。