論文の概要: A Machine Learning Approach for Hierarchical Classification of Software
Requirements
- arxiv url: http://arxiv.org/abs/2302.12599v1
- Date: Fri, 24 Feb 2023 12:33:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 13:36:12.351586
- Title: A Machine Learning Approach for Hierarchical Classification of Software
Requirements
- Title(参考訳): ソフトウェア要件の階層的分類のための機械学習アプローチ
- Authors: Manal Binkhonain, Liping Zhao
- Abstract要約: 本稿では,要件のマルチクラス分類のための新しいML手法HC4RCを提案する。
HC4RCの有効性を3つの近縁なアプローチと実験的に比較した。
- 参考スコア(独自算出の注目度): 3.8377728124578856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context: Classification of software requirements into different categories is
a critically important task in requirements engineering (RE). Developing
machine learning (ML) approaches for requirements classification has attracted
great interest in the RE community since the 2000s. Objective: This paper aims
to address two related problems that have been challenging real-world
applications of ML approaches: the problems of class imbalance and high
dimensionality with low sample size data (HDLSS). These problems can greatly
degrade the classification performance of ML methods. Method: The paper
proposes HC4RC, a novel ML approach for multiclass classification of
requirements. HC4RC solves the aforementioned problems through
semantic-role-based feature selection, dataset decomposition and hierarchical
classification. We experimentally compare the effectiveness of HC4RC with three
closely related approaches - two of which are based on a traditional
statistical classification model whereas one uses an advanced deep learning
model. Results: Our experiment shows: 1) The class imbalance and HDLSS problems
present a challenge to both traditional and advanced ML approaches. 2) The
HC4RC approach is simple to use and can effectively address the class imbalance
and HDLSS problems compared to similar approaches. Conclusion: This paper makes
an important practical contribution to addressing the class imbalance and HDLSS
problems in multiclass classification of software requirements.
- Abstract(参考訳): コンテキスト: ソフトウェア要件をさまざまなカテゴリに分類することは、要件エンジニアリング(RE)において極めて重要なタスクです。
要件分類のための機械学習(ML)アプローチの開発は、2000年代からREコミュニティに大きな関心を集めている。
目的:本稿は,ml アプローチの実世界の応用に挑戦してきた2つの問題,すなわち低サンプルサイズデータ (hdlss) のクラス不均衡と高次元の問題に対処することを目的とする。
これらの問題はML手法の分類性能を大幅に低下させる可能性がある。
方法: 要件のマルチクラス分類のための新しいML手法HC4RCを提案する。
HC4RCは、セマンティックロールに基づく特徴選択、データセットの分解、階層分類によって上記の問題を解決する。
HC4RCの有効性を3つの近縁なアプローチと実験的に比較した。その2つは従来の統計分類モデルに基づいており、一方は高度な深層学習モデルを用いている。
結果: 私たちの実験では
1) クラス不均衡とHDLSS問題は従来のMLアプローチと高度なMLアプローチの両方に課題をもたらす。
2)HC4RC法は, クラス不均衡とHDLSS問題を類似の手法と比較して効果的に扱うことができる。
結論:本論文は,ソフトウェア要件のマルチクラス分類において,クラス不均衡とHDLSS問題に対処するための重要な実践的貢献を行う。
関連論文リスト
- ErrorRadar: Benchmarking Complex Mathematical Reasoning of Multimodal Large Language Models Via Error Detection [60.297079601066784]
エラー検出におけるMLLMの能力を評価するために設計された最初のベンチマークであるErrorRadarを紹介する。
ErrorRadarはエラーステップ識別とエラー分類という2つのサブタスクを評価している。
2500の高品質なマルチモーダルK-12数学問題で構成され、実世界の学生相互作用から収集される。
GPT-4oの優れた性能は、まだ人間の評価に約10%遅れているため、大きな課題が残っている。
論文 参考訳(メタデータ) (2024-10-06T14:59:09Z) - Principled Penalty-based Methods for Bilevel Reinforcement Learning and RLHF [82.73541793388]
本稿では, ペナルティ定式化のレンズによる二レベルRL問題の解法として, 第一原理のアルゴリズムフレームワークを提案する。
本稿では,問題景観とそのペナルティに基づく勾配(政治)アルゴリズムについて理論的研究を行う。
シミュレーションによるアルゴリズムの有効性を,Stackelberg Markovゲーム,人間からのフィードバックとインセンティブ設計によるRLで実証する。
論文 参考訳(メタデータ) (2024-02-10T04:54:15Z) - Classification, Challenges, and Automated Approaches to Handle Non-Functional Requirements in ML-Enabled Systems: A Systematic Literature Review [10.09767622002672]
本稿では,これまで検討されてきた非機能要件の分類と,ML対応システムでモデルを開発する上で直面する課題の2つを対象とする体系的文献レビューを提案する。
本報告では,30種類の非機能要件を同定し,これらを6つの主要クラスに分類した。
また、23以上のソフトウェアエンジニアリング課題のカタログを編集し、機械学習対応システムの非機能要件についてさらなる研究を行ないました。
論文 参考訳(メタデータ) (2023-11-29T09:45:41Z) - Few-shot Class-incremental Learning: A Survey [16.729567512584822]
FSCIL(Few-shot Class-Incremental Learning)は機械学習(ML)においてユニークな課題を提示する
本稿は、FSCILの総合的かつ体系的なレビューを提供することを目的としている。
論文 参考訳(メタデータ) (2023-08-13T13:01:21Z) - A Survey of Methods for Addressing Class Imbalance in Deep-Learning
Based Natural Language Processing [68.37496795076203]
非バランスなデータを扱うNLP研究者や実践者に対してガイダンスを提供する。
まず、制御および実世界のクラス不均衡の様々なタイプについて論じる。
サンプリング,データ拡張,損失関数の選択,ステージ学習,モデル設計に基づく手法を整理する。
論文 参考訳(メタデータ) (2022-10-10T13:26:40Z) - Class-Imbalanced Complementary-Label Learning via Weighted Loss [8.934943507699131]
補完ラベル学習(Complementary-label Learning, CLL)は、弱い教師付き分類において広く用いられている。
クラス不均衡のトレーニングサンプルに直面すると、現実世界のデータセットでは大きな課題に直面します。
多クラス分類のためのクラス不均衡補完ラベルからの学習を可能にする新しい問題設定を提案する。
論文 参考訳(メタデータ) (2022-09-28T16:02:42Z) - Distributed Methods with Compressed Communication for Solving
Variational Inequalities, with Theoretical Guarantees [115.08148491584997]
本稿では,MASHA1 と MASHA2 の圧縮通信による変分不等式とサドル点問題の解法について理論的に検討した。
新しいアルゴリズムは双方向圧縮をサポートし、バッチの設定や、クライアントの部分的な参加を伴うフェデレーション学習のために修正することもできる。
論文 参考訳(メタデータ) (2021-10-07T10:04:32Z) - Learning with Multiclass AUC: Theory and Algorithms [141.63211412386283]
ROC曲線 (AUC) の下の領域は、不均衡学習やレコメンダシステムといった問題に対するよく知られたランキング基準である。
本稿では,マルチクラスAUCメトリクスを最適化することで,多クラススコアリング関数を学習する問題について検討する。
論文 参考訳(メタデータ) (2021-07-28T05:18:10Z) - An Online Method for A Class of Distributionally Robust Optimization
with Non-Convex Objectives [54.29001037565384]
本稿では,オンライン分散ロバスト最適化(DRO)のクラスを解決するための実用的なオンライン手法を提案する。
本研究は,ネットワークの堅牢性向上のための機械学習における重要な応用を実証する。
論文 参考訳(メタデータ) (2020-06-17T20:19:25Z) - Combined Cleaning and Resampling Algorithm for Multi-Class Imbalanced
Data with Label Noise [11.868507571027626]
本稿では,新しいオーバーサンプリング手法であるマルチクラス・コンバインド・クリーニングとリサンプリングのアルゴリズムを提案する。
提案手法は, オーバーサンプリングに適した領域をモデル化するためのエネルギーベース手法を用いて, SMOTEよりも小さな解離や外れ値の影響を受けない。
重なり合うクラス分布が学習アルゴリズムの性能に与える影響を低減することを目的として, 同時クリーニング操作と組み合わせた。
論文 参考訳(メタデータ) (2020-04-07T13:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。