論文の概要: Toward the Automatic Classification of Self-Affirmed Refactoring
- arxiv url: http://arxiv.org/abs/2009.09279v1
- Date: Sat, 19 Sep 2020 18:35:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 21:46:01.767001
- Title: Toward the Automatic Classification of Self-Affirmed Refactoring
- Title(参考訳): 自己確認リファクタリングの自動分類に向けて
- Authors: Eman Abdullah AlOmar, Mohamed Wiem Mkaouer, Ali Ouni
- Abstract要約: SAR(Self-Affirmed Refactoring)は、開発者がコミットメッセージでアクティビティをドキュメント化する方法について調査するために導入された。
まず、コミットが開発者関連の事象を記述しているかを識別し、共通の品質改善カテゴリに従って分類する2段階のアプローチを提案する。
我々のモデルは、コミットを正確に分類し、パターンベースのランダムアプローチより優れ、より関連する40のSARパターンを発見できる。
- 参考スコア(独自算出の注目度): 22.27416971215152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The concept of Self-Affirmed Refactoring (SAR) was introduced to explore how
developers document their refactoring activities in commit messages, i.e.,
developers' explicit documentation of refactoring operations intentionally
introduced during a code change. In our previous study, we have manually
identified refactoring patterns and defined three main common quality
improvement categories, including internal quality attributes, external quality
attributes, and code smells, by only considering refactoring-related commits.
However, this approach heavily depends on the manual inspection of commit
messages. In this paper, we propose a two-step approach to first identify
whether a commit describes developer-related refactoring events, then to
classify it according to the refactoring common quality improvement categories.
Specifically, we combine the N-Gram TF-IDF feature selection with binary and
multiclass classifiers to build a new model to automate the classification of
refactorings based on their quality improvement categories. We challenge our
model using a total of 2,867 commit messages extracted from well-engineered
open-source Java projects. Our findings show that (1) our model is able to
accurately classify SAR commits, outperforming the pattern-based and random
classifier approaches, and allowing the discovery of 40 more relevant SAR
patterns, and (2) our model reaches an F-measure of up to 90% even with a
relatively small training dataset.
- Abstract(参考訳): SAR(Self-Affirmed Refactoring)の概念は、開発者がコミットメッセージでリファクタリングアクティビティをドキュメント化する方法について調査するために導入された。
前回の調査ではリファクタリングのパターンを手動で識別し、リファクタリングに関連するコミットのみを考慮して、内部品質属性、外部品質属性、コードの臭いを含む3つの一般的な品質改善カテゴリを定義しました。
しかし、このアプローチはコミットメッセージの手動検査に大きく依存しています。
本稿では,まずコミットが開発者関連リファクタリングイベントを記述しているかを識別し,リファクタリング共通品質改善カテゴリに従って分類する2段階アプローチを提案する。
具体的には、N-Gram TF-IDF機能選択とバイナリとマルチクラス分類器を組み合わせることで、リファクタリングの分類を品質改善カテゴリに基づいて自動化する新しいモデルを構築する。
我々は,オープンソースのJavaプロジェクトから抽出した合計2,867件のコミットメッセージを用いて,我々のモデルに挑戦する。
その結果,本モデルでは,(1)SARコミットを正確に分類し,パターンベースおよびランダム分類器アプローチより優れ,さらに40種類のSARパターンの発見が可能であり,(2)比較的小さなトレーニングデータセットでも最大90%のF測定値が得られることがわかった。
関連論文リスト
- State of Refactoring Adoption: Better Understanding Developer Perception
of Refactoring [5.516979718589074]
ソフトウェアライフサイクルにおける開発者の活動の文書化方法について検討する。
このようなアクティビティを自己確認リファクタリング(Self-Affirmed Refactoring, SAR)と呼びます。
本稿では,コミットが開発者関連のイベントを記述しているかどうかを,共通品質改善カテゴリに従って分類するアプローチを提案する。
論文 参考訳(メタデータ) (2023-06-09T16:38:20Z) - RefBERT: A Two-Stage Pre-trained Framework for Automatic Rename
Refactoring [57.8069006460087]
本研究では,他のリネーム活動よりも難易度の高い変数名の自動改名について検討する。
変数名に対する名前変更のための2段階事前訓練フレームワークであるRefBERTを提案する。
RefBERTの変数名は既存の手法よりも正確で有意義であることを示す。
論文 参考訳(メタデータ) (2023-05-28T12:29:39Z) - Generalization Properties of Retrieval-based Models [50.35325326050263]
検索ベースの機械学習手法は、幅広い問題で成功をおさめた。
これらのモデルの約束を示す文献が増えているにもかかわらず、そのようなモデルの理論的基盤はいまだに解明されていない。
本稿では,その一般化能力を特徴付けるために,検索ベースモデルの形式的処理を行う。
論文 参考訳(メタデータ) (2022-10-06T00:33:01Z) - Exploring Category-correlated Feature for Few-shot Image Classification [27.13708881431794]
本稿では,従来の知識として,新しいクラスとベースクラスのカテゴリ相関を探索し,シンプルで効果的な特徴補正手法を提案する。
提案手法は, 広く使用されている3つのベンチマークにおいて, 一定の性能向上が得られる。
論文 参考訳(メタデータ) (2021-12-14T08:25:24Z) - Self-Supervised Class Incremental Learning [51.62542103481908]
既存のクラスインクリメンタルラーニング(CIL)手法は、データラベルに敏感な教師付き分類フレームワークに基づいている。
新しいクラスデータに基づいて更新する場合、それらは破滅的な忘れがちである。
本稿では,SSCILにおける自己指導型表現学習のパフォーマンスを初めて考察する。
論文 参考訳(メタデータ) (2021-11-18T06:58:19Z) - Self-supervised Detransformation Autoencoder for Representation Learning
in Open Set Recognition [0.0]
オープンセット認識問題に対する自己超越手法であるDetransformation Autoencoder (DTAE)を提案する。
提案手法は,未知のクラスを検出し,未知のクラスを分類する上で,大きな利益をもたらす。
論文 参考訳(メタデータ) (2021-05-28T02:45:57Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - How We Refactor and How We Document it? On the Use of Supervised Machine
Learning Algorithms to Classify Refactoring Documentation [25.626914797750487]
リファクタリングは、外部の振る舞いを変えることなく、システムの設計を改善する技術である。
この研究はコミットを、従来のBugFixやFunctionalのカテゴリとともに、内部QA、外部QA、Code Smell Resolutionの3つのカテゴリに分類する。
分類結果をよりよく理解するために、私たちはコミットメッセージを分析して、開発者が定期的に臭いを説明するために使用するパターンを抽出しました。
論文 参考訳(メタデータ) (2020-10-26T20:33:17Z) - GRIT: Generative Role-filler Transformers for Document-level Event
Entity Extraction [134.5580003327839]
本稿では、文書レベルでコンテキストをモデル化するための生成トランスフォーマーベースのエンコーダデコーダフレームワーク(GRIT)を紹介する。
我々は,MUC-4データセットに対する我々のアプローチを評価し,我々のモデルが先行作業よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-08-21T01:07:36Z) - Open-Set Recognition with Gaussian Mixture Variational Autoencoders [91.3247063132127]
推論において、オープンセット分類は、サンプルをトレーニングから既知のクラスに分類するか、未知のクラスとして拒絶するかのどちらかである。
我々は,協調的に再構築を学習し,潜在空間におけるクラスベースのクラスタリングを行うよう,我々のモデルを訓練する。
我々のモデルは、より正確で堅牢なオープンセット分類結果を実現し、平均的なF1改善率は29.5%である。
論文 参考訳(メタデータ) (2020-06-03T01:15:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。