論文の概要: Toward the Automatic Classification of Self-Affirmed Refactoring
- arxiv url: http://arxiv.org/abs/2009.09279v1
- Date: Sat, 19 Sep 2020 18:35:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-16 21:46:01.767001
- Title: Toward the Automatic Classification of Self-Affirmed Refactoring
- Title(参考訳): 自己確認リファクタリングの自動分類に向けて
- Authors: Eman Abdullah AlOmar, Mohamed Wiem Mkaouer, Ali Ouni
- Abstract要約: SAR(Self-Affirmed Refactoring)は、開発者がコミットメッセージでアクティビティをドキュメント化する方法について調査するために導入された。
まず、コミットが開発者関連の事象を記述しているかを識別し、共通の品質改善カテゴリに従って分類する2段階のアプローチを提案する。
我々のモデルは、コミットを正確に分類し、パターンベースのランダムアプローチより優れ、より関連する40のSARパターンを発見できる。
- 参考スコア(独自算出の注目度): 22.27416971215152
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The concept of Self-Affirmed Refactoring (SAR) was introduced to explore how
developers document their refactoring activities in commit messages, i.e.,
developers' explicit documentation of refactoring operations intentionally
introduced during a code change. In our previous study, we have manually
identified refactoring patterns and defined three main common quality
improvement categories, including internal quality attributes, external quality
attributes, and code smells, by only considering refactoring-related commits.
However, this approach heavily depends on the manual inspection of commit
messages. In this paper, we propose a two-step approach to first identify
whether a commit describes developer-related refactoring events, then to
classify it according to the refactoring common quality improvement categories.
Specifically, we combine the N-Gram TF-IDF feature selection with binary and
multiclass classifiers to build a new model to automate the classification of
refactorings based on their quality improvement categories. We challenge our
model using a total of 2,867 commit messages extracted from well-engineered
open-source Java projects. Our findings show that (1) our model is able to
accurately classify SAR commits, outperforming the pattern-based and random
classifier approaches, and allowing the discovery of 40 more relevant SAR
patterns, and (2) our model reaches an F-measure of up to 90% even with a
relatively small training dataset.
- Abstract(参考訳): SAR(Self-Affirmed Refactoring)の概念は、開発者がコミットメッセージでリファクタリングアクティビティをドキュメント化する方法について調査するために導入された。
前回の調査ではリファクタリングのパターンを手動で識別し、リファクタリングに関連するコミットのみを考慮して、内部品質属性、外部品質属性、コードの臭いを含む3つの一般的な品質改善カテゴリを定義しました。
しかし、このアプローチはコミットメッセージの手動検査に大きく依存しています。
本稿では,まずコミットが開発者関連リファクタリングイベントを記述しているかを識別し,リファクタリング共通品質改善カテゴリに従って分類する2段階アプローチを提案する。
具体的には、N-Gram TF-IDF機能選択とバイナリとマルチクラス分類器を組み合わせることで、リファクタリングの分類を品質改善カテゴリに基づいて自動化する新しいモデルを構築する。
我々は,オープンソースのJavaプロジェクトから抽出した合計2,867件のコミットメッセージを用いて,我々のモデルに挑戦する。
その結果,本モデルでは,(1)SARコミットを正確に分類し,パターンベースおよびランダム分類器アプローチより優れ,さらに40種類のSARパターンの発見が可能であり,(2)比較的小さなトレーニングデータセットでも最大90%のF測定値が得られることがわかった。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Context-Enhanced LLM-Based Framework for Automatic Test Refactoring [10.847400457238423]
テストの臭いは、設計プラクティスの貧弱さとドメイン知識の不足から生じます。
我々は,Javaプロジェクトにおける自動テストのための文脈拡張型LLMベースのフレームワークUTRefactorを提案する。
6つのオープンソースのJavaプロジェクトから879のテストに対してUTRefactorを評価し、テストの匂いを2,375から265に減らし、89%の削減を実現した。
論文 参考訳(メタデータ) (2024-09-25T08:42:29Z) - Large Language Model-guided Document Selection [23.673690115025913]
大規模言語モデル(LLM)の事前学習は、ますます増加する計算予算を消費する。
近年の研究では、ドキュメントの選択がFLOPのごく一部で同等のモデル品質を実現することが実証されている。
拡張性のある汎用ドメイン文書選択のための有望な方向を探究する。
論文 参考訳(メタデータ) (2024-06-07T04:52:46Z) - Evaluating Generative Language Models in Information Extraction as Subjective Question Correction [49.729908337372436]
本稿では,新しい評価手法SQC-Scoreを提案する。
主観的質問訂正の原則に着想を得て,新しい評価手法SQC-Scoreを提案する。
3つの情報抽出タスクの結果から,SQC-Scoreは基準値よりもアノテータの方が好ましいことが示された。
論文 参考訳(メタデータ) (2024-04-04T15:36:53Z) - Generative Multi-modal Models are Good Class-Incremental Learners [51.5648732517187]
クラス増分学習のための新しい生成型マルチモーダルモデル(GMM)フレームワークを提案する。
提案手法は適応生成モデルを用いて画像のラベルを直接生成する。
Few-shot CIL設定では、現在の最先端のすべてのメソッドに対して少なくとも14%精度が向上し、忘れてはならない。
論文 参考訳(メタデータ) (2024-03-27T09:21:07Z) - State of Refactoring Adoption: Better Understanding Developer Perception
of Refactoring [5.516979718589074]
ソフトウェアライフサイクルにおける開発者の活動の文書化方法について検討する。
このようなアクティビティを自己確認リファクタリング(Self-Affirmed Refactoring, SAR)と呼びます。
本稿では,コミットが開発者関連のイベントを記述しているかどうかを,共通品質改善カテゴリに従って分類するアプローチを提案する。
論文 参考訳(メタデータ) (2023-06-09T16:38:20Z) - RefBERT: A Two-Stage Pre-trained Framework for Automatic Rename
Refactoring [57.8069006460087]
本研究では,他のリネーム活動よりも難易度の高い変数名の自動改名について検討する。
変数名に対する名前変更のための2段階事前訓練フレームワークであるRefBERTを提案する。
RefBERTの変数名は既存の手法よりも正確で有意義であることを示す。
論文 参考訳(メタデータ) (2023-05-28T12:29:39Z) - Self-supervised Detransformation Autoencoder for Representation Learning
in Open Set Recognition [0.0]
オープンセット認識問題に対する自己超越手法であるDetransformation Autoencoder (DTAE)を提案する。
提案手法は,未知のクラスを検出し,未知のクラスを分類する上で,大きな利益をもたらす。
論文 参考訳(メタデータ) (2021-05-28T02:45:57Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - How We Refactor and How We Document it? On the Use of Supervised Machine
Learning Algorithms to Classify Refactoring Documentation [25.626914797750487]
リファクタリングは、外部の振る舞いを変えることなく、システムの設計を改善する技術である。
この研究はコミットを、従来のBugFixやFunctionalのカテゴリとともに、内部QA、外部QA、Code Smell Resolutionの3つのカテゴリに分類する。
分類結果をよりよく理解するために、私たちはコミットメッセージを分析して、開発者が定期的に臭いを説明するために使用するパターンを抽出しました。
論文 参考訳(メタデータ) (2020-10-26T20:33:17Z) - Open-Set Recognition with Gaussian Mixture Variational Autoencoders [91.3247063132127]
推論において、オープンセット分類は、サンプルをトレーニングから既知のクラスに分類するか、未知のクラスとして拒絶するかのどちらかである。
我々は,協調的に再構築を学習し,潜在空間におけるクラスベースのクラスタリングを行うよう,我々のモデルを訓練する。
我々のモデルは、より正確で堅牢なオープンセット分類結果を実現し、平均的なF1改善率は29.5%である。
論文 参考訳(メタデータ) (2020-06-03T01:15:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。