論文の概要: Identifying Self-Admitted Technical Debt in Issue Tracking Systems using
Machine Learning
- arxiv url: http://arxiv.org/abs/2202.02180v1
- Date: Fri, 4 Feb 2022 15:15:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-07 15:29:32.143820
- Title: Identifying Self-Admitted Technical Debt in Issue Tracking Systems using
Machine Learning
- Title(参考訳): 機械学習を用いた課題追跡システムにおける自己申告技術的負債の特定
- Authors: Yikun Li, Mohamed Soliman, Paris Avgeriou
- Abstract要約: 技術的負債は短期的利益のために実装された準最適ソリューションのメタファーである。
Self-Admitted Technical Debtの特定に関する作業の多くは、ソースコードのコメントに重点を置いている。
本稿では,機械学習を用いた問題追跡システムにおけるSATDの自動識別手法の提案と最適化を行う。
- 参考スコア(独自算出の注目度): 3.446864074238136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Technical debt is a metaphor indicating sub-optimal solutions implemented for
short-term benefits by sacrificing the long-term maintainability and
evolvability of software. A special type of technical debt is explicitly
admitted by software engineers (e.g. using a TODO comment); this is called
Self-Admitted Technical Debt or SATD. Most work on automatically identifying
SATD focuses on source code comments. In addition to source code comments,
issue tracking systems have shown to be another rich source of SATD, but there
are no approaches specifically for automatically identifying SATD in issues. In
this paper, we first create a training dataset by collecting and manually
analyzing 4,200 issues (that break down to 23,180 sections of issues) from
seven open-source projects (i.e., Camel, Chromium, Gerrit, Hadoop, HBase,
Impala, and Thrift) using two popular issue tracking systems (i.e., Jira and
Google Monorail). We then propose and optimize an approach for automatically
identifying SATD in issue tracking systems using machine learning. Our findings
indicate that: 1) our approach outperforms baseline approaches by a wide margin
with regard to the F1-score; 2) transferring knowledge from suitable datasets
can improve the predictive performance of our approach; 3) extracted SATD
keywords are intuitive and potentially indicating types and indicators of SATD;
4) projects using different issue tracking systems have less common SATD
keywords compared to projects using the same issue tracking system; 5) a small
amount of training data is needed to achieve good accuracy.
- Abstract(参考訳): 技術的負債は、ソフトウェアの長期的な保守性と進化性を犠牲にして、短期的な利益のために実装される副最適ソリューションを示すメタファーです。
特別なタイプの技術的負債は、ソフトウェアエンジニア(例えばTODOコメントを使用する)によって明示的に認められ、これはSelf-Admitted Technical DebtまたはSATDと呼ばれる。
SATDを自動的に識別する作業のほとんどは、ソースコードのコメントに重点を置いている。
ソースコードのコメントに加えて、イシュートラッキングシステムはSATDのもう1つのリッチソースであることが示されているが、問題のSATDを自動的に識別するためのアプローチはない。
本稿ではまず,7つのオープンソースプロジェクト (camel, chromium, gerrit, hadoop, hbase, impala, thrift) から,2つの一般的なイシュートラッキングシステム (jira と google monorail) を使用して,4,200のイシュー(問題のセクションを23,180に分解する)を収集し,手作業で分析して,トレーニングデータセットを作成する。
次に,機械学習を用いた問題追跡システムにおけるSATDの自動識別手法を提案する。
私たちの発見は
1)F1スコアに関して,我々のアプローチはベースラインアプローチよりも広いマージンで優れている。
2)適切なデータセットから知識を伝達することで,アプローチの予測性能を向上させることができる。
3)抽出されたsatdキーワードは,直感的で,satdの型及び指標を示す可能性がある。
4) 異なる課題追跡システムを使用するプロジェクトは,同じ課題追跡システムを使用するプロジェクトに比べてSATDキーワードが少ない。
5)精度を上げるためには,少量のトレーニングデータが必要である。
関連論文リスト
- Deep Learning and Data Augmentation for Detecting Self-Admitted Technical Debt [6.004718679054704]
Self-Admitted Technical Debt (SATD)は、開発者がテキストアーティファクトを使用して、既存の実装が最適でない理由を説明する状況を指す。
SATD と BERT のバイナリ識別に BiLSTM アーキテクチャを用い,様々な SATD の分類を行った。
異なるアーティファクトから派生した様々なデータセットからSATDを識別・分類するための2段階のアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-21T09:22:16Z) - A Taxonomy of Self-Admitted Technical Debt in Deep Learning Systems [13.90991624629898]
本稿では,ディープラーニングシステムにおける自己受け入れ技術的負債(SATD)の存在を実証的に分析する。
オープンコーディングにより, DL特異的SATDの分類を導出し, 7つのカテゴリと41の葉を特徴とした。
論文 参考訳(メタデータ) (2024-09-18T09:21:10Z) - Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化(英: Uncertainty Quantification、UQ)は、機械学習(ML)アプリケーションにおいて重要なコンポーネントである。
最新のUQベースラインの集合を実装した新しいベンチマークを導入する。
我々は、9つのタスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も有望なアプローチを特定した。
論文 参考訳(メタデータ) (2024-06-21T20:06:31Z) - SATDAUG -- A Balanced and Augmented Dataset for Detecting Self-Admitted
Technical Debt [6.699060157800401]
自己承認技術的負債(Self-admitted Technical debt、SATD)とは、開発者が技術的ショートカットの存在を明確に認識し、文書化する技術的負債の一種である。
textitSATDAUGデータセットは、ソースコードコメント、イシュートラッカ、プルリクエスト、コミットメッセージを含む既存のSATDデータセットの拡張バージョンです。
論文 参考訳(メタデータ) (2024-03-12T14:33:53Z) - Towards Automatically Addressing Self-Admitted Technical Debt: How Far
Are We? [17.128428286986573]
本稿では,ニューラルベース生成モデルによって技術的負債を自動的に返済できる範囲を実験的に検討する。
595のオープンソースプロジェクトから5,039件の自己申告技術的負債(SATD)の削除日程を抽出することから始めます。
このデータセットを用いて、7つの異なる生成ディープラーニング(DL)モデル構成を実験する。
論文 参考訳(メタデータ) (2023-08-17T12:27:32Z) - Machine Learning Methods in Solving the Boolean Satisfiability Problem [72.21206588430645]
本論文は, Boolean satisfiability problem (SAT) を機械学習技術で解くことに関する最近の文献をレビューする。
ML-SATソルバを手作り特徴を持つナイーブ分類器からNeuroSATのような新たなエンド・ツー・エンドSATソルバまで,進化するML-SATソルバについて検討する。
論文 参考訳(メタデータ) (2022-03-02T05:14:12Z) - Automatic Identification of Self-Admitted Technical Debt from Four
Different Sources [3.446864074238136]
技術的負債とは、ソフトウェアシステムの長期的な保守性と進化性を犠牲にして、短期的な目標を達成するためにショートカットを取ることを指す。
これまでの作業は、ソースコードコメントとイシュートラッカからSATDを識別することに集中していた。
ソースコードコメント,コミットメッセージ,プルリクエスト,イシュートラッキングシステムという4つのソースを統合したSATDの自動識別手法を提案する。
論文 参考訳(メタデータ) (2022-02-04T20:59:25Z) - Benchmarking high-fidelity pedestrian tracking systems for research,
real-time monitoring and crowd control [55.41644538483948]
実生活環境における高忠実な歩行者追跡は,群集動態研究において重要なツールである。
この技術が進歩するにつれて、社会においても益々有用になってきている。
歩行者追跡技術の研究と技術に成功させるためには、正確さの検証とベンチマークが不可欠である。
我々は、プライバシーに配慮した歩行者追跡技術のためのベンチマークスイートをコミュニティのオープンスタンダードに向けて提示し、議論する。
論文 参考訳(メタデータ) (2021-08-26T11:45:26Z) - Transformer-based Machine Learning for Fast SAT Solvers and Logic
Synthesis [63.53283025435107]
CNFベースのSATとMaxSATは論理合成と検証システムの中心である。
そこで本研究では,Transformerアーキテクチャから派生したワンショットモデルを用いて,MaxSAT問題の解法を提案する。
論文 参考訳(メタデータ) (2021-07-15T04:47:35Z) - Conditioned Text Generation with Transfer for Closed-Domain Dialogue
Systems [65.48663492703557]
条件付き変分オートエンコーダを用いて,意図特化文の生成を最適に学習し,制御する方法を示す。
クエリ転送と呼ばれる新しいプロトコルを導入し、大規模で遅延のないデータセットを活用できるようにします。
論文 参考訳(メタデータ) (2020-11-03T14:06:10Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。