Fugu-MT 論文翻訳(概要): Identifying Self-Admitted Technical Debt in Issue Tracking Systems using Machine Learning

論文の概要: Identifying Self-Admitted Technical Debt in Issue Tracking Systems using Machine Learning

arxiv url: http://arxiv.org/abs/2202.02180v1
Date: Fri, 4 Feb 2022 15:15:13 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-07 15:29:32.143820
Title: Identifying Self-Admitted Technical Debt in Issue Tracking Systems using Machine Learning
Title（参考訳）: 機械学習を用いた課題追跡システムにおける自己申告技術的負債の特定
Authors: Yikun Li, Mohamed Soliman, Paris Avgeriou
Abstract要約: 技術的負債は短期的利益のために実装された準最適ソリューションのメタファーである。 Self-Admitted Technical Debtの特定に関する作業の多くは、ソースコードのコメントに重点を置いている。本稿では,機械学習を用いた問題追跡システムにおけるSATDの自動識別手法の提案と最適化を行う。
参考スコア（独自算出の注目度）: 3.446864074238136
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Technical debt is a metaphor indicating sub-optimal solutions implemented for short-term benefits by sacrificing the long-term maintainability and evolvability of software. A special type of technical debt is explicitly admitted by software engineers (e.g. using a TODO comment); this is called Self-Admitted Technical Debt or SATD. Most work on automatically identifying SATD focuses on source code comments. In addition to source code comments, issue tracking systems have shown to be another rich source of SATD, but there are no approaches specifically for automatically identifying SATD in issues. In this paper, we first create a training dataset by collecting and manually analyzing 4,200 issues (that break down to 23,180 sections of issues) from seven open-source projects (i.e., Camel, Chromium, Gerrit, Hadoop, HBase, Impala, and Thrift) using two popular issue tracking systems (i.e., Jira and Google Monorail). We then propose and optimize an approach for automatically identifying SATD in issue tracking systems using machine learning. Our findings indicate that: 1) our approach outperforms baseline approaches by a wide margin with regard to the F1-score; 2) transferring knowledge from suitable datasets can improve the predictive performance of our approach; 3) extracted SATD keywords are intuitive and potentially indicating types and indicators of SATD; 4) projects using different issue tracking systems have less common SATD keywords compared to projects using the same issue tracking system; 5) a small amount of training data is needed to achieve good accuracy.
Abstract（参考訳）: 技術的負債は、ソフトウェアの長期的な保守性と進化性を犠牲にして、短期的な利益のために実装される副最適ソリューションを示すメタファーです。特別なタイプの技術的負債は、ソフトウェアエンジニア(例えばTODOコメントを使用する)によって明示的に認められ、これはSelf-Admitted Technical DebtまたはSATDと呼ばれる。 SATDを自動的に識別する作業のほとんどは、ソースコードのコメントに重点を置いている。ソースコードのコメントに加えて、イシュートラッキングシステムはSATDのもう1つのリッチソースであることが示されているが、問題のSATDを自動的に識別するためのアプローチはない。本稿ではまず,7つのオープンソースプロジェクト (camel, chromium, gerrit, hadoop, hbase, impala, thrift) から,2つの一般的なイシュートラッキングシステム (jira と google monorail) を使用して,4,200のイシュー(問題のセクションを23,180に分解する)を収集し,手作業で分析して,トレーニングデータセットを作成する。次に,機械学習を用いた問題追跡システムにおけるSATDの自動識別手法を提案する。私たちの発見は 1)F1スコアに関して,我々のアプローチはベースラインアプローチよりも広いマージンで優れている。 2)適切なデータセットから知識を伝達することで,アプローチの予測性能を向上させることができる。 3)抽出されたsatdキーワードは,直感的で,satdの型及び指標を示す可能性がある。 4) 異なる課題追跡システムを使用するプロジェクトは,同じ課題追跡システムを使用するプロジェクトに比べてSATDキーワードが少ない。 5)精度を上げるためには,少量のトレーニングデータが必要である。

関連論文リスト

A First Look at the Self-Admitted Technical Debt in Test Code: Taxonomy and Detection [7.475625941772781]
自己承認技術的負債(Self-admitted Technical debt,SATD)とは、開発者がコードの問題や回避策、あるいは準最適ソリューションを明確に認めるコメントのことである。本研究では,1000のオープンソースJavaプロジェクトを対象に,160万件のコメントからランダムに5万件のコメントをランダムに分析することにより,SATDをテストコードで解析する。
論文参考訳（メタデータ） (2025-10-25T19:09:18Z)
Barbarians at the Gate: How AI is Upending Systems Research [58.95406995634148]
システム研究は、新しいパフォーマンス指向アルゴリズムの設計と評価に長年注力してきたが、AI駆動のソリューション発見には特に適している、と私たちは主張する。このアプローチをAI駆動システム研究(ADRS)と呼び、ソリューションを反復的に生成し、評価し、洗練する。我々の研究結果は、AI時代のシステム研究の実践に急激な適応の必要性と破壊的な可能性を浮き彫りにしている。
論文参考訳（メタデータ） (2025-10-07T17:49:24Z)
TrustGeoGen: Formal-Verified Data Engine for Trustworthy Multi-modal Geometric Problem Solving [106.04001249574786]
TrustGeoGenは、標準的で信頼性の高いベンチマークを確立するために、正式に検証された幾何問題を生成するデータエンジンである。 1)ダイアグラム,テキスト,ステップバイステップのソリューションの生成を同期するマルチモーダルアライメント,2)すべての推論パスがルール準拠であることを保証する形式検証,3)接続思考,ブリッジング,ヒューマンライクな論理ステップとの論理的推論,4)複数のソリューションと自己回帰バックトラックを備えた多種多様な問題を生成できるTextitGeoExploreシリーズアルゴリズム。
論文参考訳（メタデータ） (2025-04-22T10:45:23Z)
Aligning Multimodal LLM with Human Preference: A Survey [62.89722942008262]
大規模言語モデル(LLM)は、タスク固有のトレーニングを必要とせずに、単純なプロンプトで幅広い汎用タスクを処理できる。 MLLM(Multimodal Large Language Models)は、視覚的、聴覚的、テキスト的データを含む複雑なタスクに対処する大きな可能性を実証している。しかし、真理性、安全性、o1のような推論、および人間の嗜好との整合性に関する重要な問題は未解決のままである。
論文参考訳（メタデータ） (2025-03-18T17:59:56Z)
Deep Learning and Data Augmentation for Detecting Self-Admitted Technical Debt [6.004718679054704]
Self-Admitted Technical Debt (SATD)は、開発者がテキストアーティファクトを使用して、既存の実装が最適でない理由を説明する状況を指す。 SATD と BERT のバイナリ識別に BiLSTM アーキテクチャを用い,様々な SATD の分類を行った。異なるアーティファクトから派生した様々なデータセットからSATDを識別・分類するための2段階のアプローチを提案する。
論文参考訳（メタデータ） (2024-10-21T09:22:16Z)
A Taxonomy of Self-Admitted Technical Debt in Deep Learning Systems [13.90991624629898]
本稿では,ディープラーニングシステムにおける自己受け入れ技術的負債(SATD)の存在を実証的に分析する。オープンコーディングにより, DL特異的SATDの分類を導出し, 7つのカテゴリと41の葉を特徴とした。
論文参考訳（メタデータ） (2024-09-18T09:21:10Z)
AutoBencher: Towards Declarative Benchmark Construction [74.54640925146289]
AutoBencherを使って、数学、多言語性、知識、安全性のためのデータセットを作成しています。 AutoBencherのスケーラビリティにより、詳細なカテゴリ知識をテストでき、既存のベンチマークよりも22%のモデルエラー(難易度)を誘発するデータセットを作成することができる。
論文参考訳（メタデータ） (2024-07-11T10:03:47Z)
Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph [83.90988015005934]
不確実性定量化(英: Uncertainty Quantification、UQ)は、機械学習(ML)アプリケーションにおいて重要なコンポーネントである。最新のUQベースラインの集合を実装した新しいベンチマークを導入する。我々は、9つのタスクにわたるUQと正規化技術に関する大規模な実証的研究を行い、最も有望なアプローチを特定した。
論文参考訳（メタデータ） (2024-06-21T20:06:31Z)
SATDAUG -- A Balanced and Augmented Dataset for Detecting Self-Admitted Technical Debt [6.699060157800401]
自己承認技術的負債(Self-admitted Technical debt、SATD)とは、開発者が技術的ショートカットの存在を明確に認識し、文書化する技術的負債の一種である。 textitSATDAUGデータセットは、ソースコードコメント、イシュートラッカ、プルリクエスト、コミットメッセージを含む既存のSATDデータセットの拡張バージョンです。
論文参考訳（メタデータ） (2024-03-12T14:33:53Z)
Towards Automatically Addressing Self-Admitted Technical Debt: How Far Are We? [17.128428286986573]
本稿では,ニューラルベース生成モデルによって技術的負債を自動的に返済できる範囲を実験的に検討する。 595のオープンソースプロジェクトから5,039件の自己申告技術的負債(SATD)の削除日程を抽出することから始めます。このデータセットを用いて、7つの異なる生成ディープラーニング(DL)モデル構成を実験する。
論文参考訳（メタデータ） (2023-08-17T12:27:32Z)
Machine Learning Methods in Solving the Boolean Satisfiability Problem [72.21206588430645]
本論文は, Boolean satisfiability problem (SAT) を機械学習技術で解くことに関する最近の文献をレビューする。 ML-SATソルバを手作り特徴を持つナイーブ分類器からNeuroSATのような新たなエンド・ツー・エンドSATソルバまで,進化するML-SATソルバについて検討する。
論文参考訳（メタデータ） (2022-03-02T05:14:12Z)
Automatic Identification of Self-Admitted Technical Debt from Four Different Sources [3.446864074238136]
技術的負債とは、ソフトウェアシステムの長期的な保守性と進化性を犠牲にして、短期的な目標を達成するためにショートカットを取ることを指す。これまでの作業は、ソースコードコメントとイシュートラッカからSATDを識別することに集中していた。ソースコードコメント,コミットメッセージ,プルリクエスト,イシュートラッキングシステムという4つのソースを統合したSATDの自動識別手法を提案する。
論文参考訳（メタデータ） (2022-02-04T20:59:25Z)
Benchmarking high-fidelity pedestrian tracking systems for research, real-time monitoring and crowd control [55.41644538483948]
実生活環境における高忠実な歩行者追跡は,群集動態研究において重要なツールである。この技術が進歩するにつれて、社会においても益々有用になってきている。歩行者追跡技術の研究と技術に成功させるためには、正確さの検証とベンチマークが不可欠である。我々は、プライバシーに配慮した歩行者追跡技術のためのベンチマークスイートをコミュニティのオープンスタンダードに向けて提示し、議論する。
論文参考訳（メタデータ） (2021-08-26T11:45:26Z)
Transformer-based Machine Learning for Fast SAT Solvers and Logic Synthesis [63.53283025435107]
CNFベースのSATとMaxSATは論理合成と検証システムの中心である。そこで本研究では,Transformerアーキテクチャから派生したワンショットモデルを用いて,MaxSAT問題の解法を提案する。
論文参考訳（メタデータ） (2021-07-15T04:47:35Z)
Conditioned Text Generation with Transfer for Closed-Domain Dialogue Systems [65.48663492703557]
条件付き変分オートエンコーダを用いて,意図特化文の生成を最適に学習し,制御する方法を示す。クエリ転送と呼ばれる新しいプロトコルを導入し、大規模で遅延のないデータセットを活用できるようにします。
論文参考訳（メタデータ） (2020-11-03T14:06:10Z)
FairMOT: On the Fairness of Detection and Re-Identification in Multiple Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。このアプローチは、検出と追跡の両方において高い精度を達成する。
論文参考訳（メタデータ） (2020-04-04T08:18:00Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。