Fugu-MT 論文翻訳(概要): Automatic Identification of Self-Admitted Technical Debt from Four Different Sources

論文の概要: Automatic Identification of Self-Admitted Technical Debt from Four Different Sources

arxiv url: http://arxiv.org/abs/2202.02387v5
Date: Fri, 21 Apr 2023 11:39:33 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-24 18:39:03.084388
Title: Automatic Identification of Self-Admitted Technical Debt from Four Different Sources
Title（参考訳）: 4つの異なるソースからの自己承認技術的負債の自動識別
Authors: Yikun Li, Mohamed Soliman, Paris Avgeriou
Abstract要約: 技術的負債とは、ソフトウェアシステムの長期的な保守性と進化性を犠牲にして、短期的な目標を達成するためにショートカットを取ることを指す。これまでの作業は、ソースコードコメントとイシュートラッカからSATDを識別することに集中していた。ソースコードコメント,コミットメッセージ,プルリクエスト,イシュートラッキングシステムという4つのソースを統合したSATDの自動識別手法を提案する。
参考スコア（独自算出の注目度）: 3.446864074238136
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Technical debt refers to taking shortcuts to achieve short-term goals while sacrificing the long-term maintainability and evolvability of software systems. A large part of technical debt is explicitly reported by the developers themselves; this is commonly referred to as Self-Admitted Technical Debt or SATD. Previous work has focused on identifying SATD from source code comments and issue trackers. However, there are no approaches available for automatically identifying SATD from other sources such as commit messages and pull requests, or by combining multiple sources. Therefore, we propose and evaluate an approach for automated SATD identification that integrates four sources: source code comments, commit messages, pull requests, and issue tracking systems. Our findings show that our approach outperforms baseline approaches and achieves an average F1-score of 0.611 when detecting four types of SATD (i.e., code/design debt, requirement debt, documentation debt, and test debt) from the four aforementioned sources. Thereafter, we analyze 23.6M code comments, 1.3M commit messages, 3.7M issue sections, and 1.7M pull request sections to characterize SATD in 103 open-source projects. Furthermore, we investigate the SATD keywords and relations between SATD in different sources. The findings indicate, among others, that: 1) SATD is evenly spread among all sources; 2) issues and pull requests are the two most similar sources regarding the number of shared SATD keywords, followed by commit messages, and then followed by code comments; 3) there are four kinds of relations between SATD items in the different sources.
Abstract（参考訳）: 技術的負債とは、ソフトウェアシステムの長期的な保守性と進化性を犠牲にして、短期的な目標を達成するためにショートカットを取ることを指す。技術的負債の大部分は、開発者自身によって明示的に報告されており、一般的には、セルフコミットメント技術的負債(Self-Admitted Technical Debt、SATD)と呼ばれる。これまでの作業は、ソースコードコメントとイシュートラッカからSATDを識別することに集中していた。しかし、コミットメッセージやプルリクエストなどの他のソースからSATDを自動的に識別するアプローチや、複数のソースを組み合わせるアプローチはない。そこで我々は,ソースコードコメント,コミットメッセージ,プルリクエスト,イシュートラッキングシステムという4つのソースを統合する自動satd識別手法を提案し,評価する。提案手法は, 4種類のSATD(コード/設計負債, 要件負債, ドキュメント負債, テスト負債)を検出する場合に, ベースラインアプローチより優れ, 平均F1スコアが0.611であることを示す。その後、23.6mのコードコメント、1.3mコミットメッセージ、3.7m発行セクション、1.7mプルリクエストセクションを分析し、103のオープンソースプロジェクトでsatdを特徴付ける。さらに,SATD キーワードと SATD の関係について検討した。この発見は、以下を示唆している。 1)SATDは,すべてのソースに均等に分散する。 2) 問題とプルリクエストは,共有satキーワードの数,コミットメッセージ,コードコメントに関して,最もよく似た2つのソースである。 3)異なるソースにsat項目間の関係は4種類ある。

関連論文リスト

AgentIR: Reasoning-Aware Retrieval for Deep Research Agents [76.29382561831105]
ディープリサーチエージェントは、各検索の前に明示的な自然言語推論を生成する。 Reasoning-Aware Retrievalは、クエリと一緒にエージェントの推論トレースを埋め込む。 DR-Synthは、標準的なQAデータセットからDeep Researchレトリバーのトレーニングデータを生成する。 AgentIR-4Bは、オープンウェイトエージェントであるTongyi-DeepResearchで68%の精度を達成する。
論文参考訳（メタデータ） (2026-03-04T18:47:26Z)
Hidden in Plain Sight: Where Developers Confess Self-Admitted Technical Debt [3.0178994719454564]
Self-Admitted Technical Debt (SATD)は、プロアクティブなソフトウェアのメンテナンスに不可欠である。従来の研究は主にSATDの検出と優先順位付けを目標としており、SATDに係わるソースコードにはほとんど焦点を当てていない。我々は、9000以上のJava Open Source Software (OSS)リポジトリからのコードコメントを含む広範なSATDデータセットであるPENTACETを活用している。 SATDが最も一般的に発生する場所と、最も頻繁に影響を受けるコード構成/ステートメントを定量的に推測する。
論文参考訳（メタデータ） (2025-11-03T12:47:19Z)
A First Look at the Self-Admitted Technical Debt in Test Code: Taxonomy and Detection [7.475625941772781]
自己承認技術的負債(Self-admitted Technical debt,SATD)とは、開発者がコードの問題や回避策、あるいは準最適ソリューションを明確に認めるコメントのことである。本研究では,1000のオープンソースJavaプロジェクトを対象に,160万件のコメントからランダムに5万件のコメントをランダムに分析することにより,SATDをテストコードで解析する。
論文参考訳（メタデータ） (2025-10-25T19:09:18Z)
DeepTRACE: Auditing Deep Research AI Systems for Tracking Reliability Across Citations and Evidence [50.97612134791782]
生成検索エンジンと深層研究のLLMエージェントは、信頼できるソース・グラウンドの合成を約束するが、ユーザーは常に過剰な自信、弱いソーシング、紛らわしい引用の慣行に遭遇する。 DeepTRACEは、社会技術的に基礎をおく新しい監査フレームワークで、コミュニティが特定した失敗事例を、回答テキスト、情報源、引用にまたがる8つの測定可能な次元に変換する。
論文参考訳（メタデータ） (2025-09-02T00:32:38Z)
T^2Agent A Tool-augmented Multimodal Misinformation Detection Agent with Monte Carlo Tree Search [51.91311158085973]
多重モーダル誤報は、しばしば混合偽造源から発生し、動的推論と適応的検証を必要とする。我々はモンテカルロ木探索を用いたツールキットを組み込んだ新しい誤情報検出剤T2Agentを提案する。大規模な実験により、T2Agentは、混在するマルチモーダル誤報ベンチマークにおいて、既存のベースラインを一貫して上回っていることが示されている。
論文参考訳（メタデータ） (2025-05-26T09:50:55Z)
Negativity in Self-Admitted Technical Debt: How Sentiment Influences Prioritization [50.07057212504773]
SATD(Self-Admitted Technical Debt)は、ソフトウェアシステムに存在する技術的負債の自己申告書である。ソフトウェアシステムにおけるSATDの記述の約4分の1は、何らかの否定的感情や否定的な感情を表現している。我々の研究は、開発者がSATDにおいて、特定のTDのインスタンスがどの程度緊急に対処されるべきかを決定するために、どのように積極的にネガティビティを利用するかを示している。
論文参考訳（メタデータ） (2025-01-02T05:33:43Z)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化(英: Uncertainty Quantification、UQ)は、機械学習(ML)アプリケーションにおいて重要なコンポーネントである。最新のUQベースラインの集合を実装した新しいベンチマークを導入する。我々は、9つのタスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も有望なアプローチを特定した。
論文参考訳（メタデータ） (2024-06-21T20:06:31Z)
An Exploratory Study of the Relationship between SATD and Other Software Development Activities [13.026170714454071]
Self-Admitted Technical Debt (SATD)は、開発者が負債を思い出させるためにコードをドキュメント化する、特定のタイプのTechnical Debtである。これまでの研究では、SATDの様々な側面を探求してきた。本研究ではSATDの削除と追加とバグ修正,新機能の追加,テストなどの活動との関係について検討する。
論文参考訳（メタデータ） (2024-04-02T13:45:42Z)
SATDAUG -- A Balanced and Augmented Dataset for Detecting Self-Admitted Technical Debt [6.699060157800401]
自己承認技術的負債(Self-admitted Technical debt、SATD)とは、開発者が技術的ショートカットの存在を明確に認識し、文書化する技術的負債の一種である。 textitSATDAUGデータセットは、ソースコードコメント、イシュートラッカ、プルリクエスト、コミットメッセージを含む既存のSATDデータセットの拡張バージョンです。
論文参考訳（メタデータ） (2024-03-12T14:33:53Z)
Evaluating Verifiability in Generative Search Engines [70.59477647085387]
生成検索エンジンは、インラインの引用とともに、ユーザークエリへの応答を直接生成する。我々は,一般的な4つの生成検索エンジンの評価を行う。既存の生成検索エンジンからの応答は流動的であり、情報的に見えるが、しばしばサポートされていない文や不正確な引用を含んでいる。
論文参考訳（メタデータ） (2023-04-19T17:56:12Z)
PENTACET data -- 23 Million Contextual Code Comments and 250,000 SATD comments [3.6095388702618414]
SATD(Self-Admitted Technical Debt)研究の多くは、SATD検出に「TODO」や「FIXME」のような明示的なSATD特徴を用いる。この作業は、PENTACET(あるいは5Cデータセット)データを通じて、このギャップに対処する。結果は2300万のコードコメント、各コメントのソースコードコンテキストの前と後、そしてSATDとラベル付けされた25万以上のコメントからなるデータセットである。
論文参考訳（メタデータ） (2023-03-24T14:42:42Z)
Automatically Identifying Relations Between Self-Admitted Technical Debt Across Different Sources [3.446864074238136]
Self-Admitted Technical DebtまたはSATDは、ソースコードコメント、コミットメッセージ、イシュートラッキングシステム、プルリクエストなど、さまざまなソースで見ることができる。従来の研究は、SATDアイテム間の関係を異なるソースで確立してきた。異なるソース間でSATD関係を自動的に識別するためのアプローチを提案し,評価する。
論文参考訳（メタデータ） (2023-03-13T13:03:55Z)
Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions [50.114651561111245]
マルチステップ質問応答のための新しいアプローチであるIRCoTを提案する。 CoTのステップで検索をインターリーブし、CoTで検索を誘導し、検索結果を用いてCoTを改善する。
論文参考訳（メタデータ） (2022-12-20T18:26:34Z)
Identifying Self-Admitted Technical Debt in Issue Tracking Systems using Machine Learning [3.446864074238136]
技術的負債は短期的利益のために実装された準最適ソリューションのメタファーである。 Self-Admitted Technical Debtの特定に関する作業の多くは、ソースコードのコメントに重点を置いている。本稿では,機械学習を用いた問題追跡システムにおけるSATDの自動識別手法の提案と最適化を行う。
論文参考訳（メタデータ） (2022-02-04T15:15:13Z)
S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。 BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文参考訳（メタデータ） (2021-03-18T21:10:41Z)
GMOT-40: A Benchmark for Generic Multiple Object Tracking [65.80411267046786]
我々はジェネリック・マルチプル・オブジェクト・トラッキング(GMOT)の研究を3つの側面で促進するために貢献する。まず、GMOT-40と呼ばれる最初の公開GMOTデータセットを構築する。第二に、専用追跡アルゴリズムの欠如に留意して、一連のベースラインGMOTアルゴリズムを設計した。第3に、一般的なMOTアルゴリズムと提案したベースラインを含むGMOT-40の徹底的な評価を行う。
論文参考訳（メタデータ） (2020-11-24T02:51:46Z)
Open Question Answering over Tables and Text [55.8412170633547]
オープンな質問応答(QA)では、質問に対する回答は、質問に対する回答を含む可能性のある文書を検索して分析することによって生成される。ほとんどのオープンQAシステムは、構造化されていないテキストからのみ情報を取得することを検討している。我々は,このタスクの性能を評価するために,新しい大規模データセット Open Table-and-Text Question Answering (OTT-QA) を提案する。
論文参考訳（メタデータ） (2020-10-20T16:48:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。