論文の概要: Multi-Label Requirements Classification with Large Taxonomies
- arxiv url: http://arxiv.org/abs/2406.04797v2
- Date: Thu, 13 Jun 2024 06:55:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-14 13:51:18.988914
- Title: Multi-Label Requirements Classification with Large Taxonomies
- Title(参考訳): 大規模分類を用いたマルチラベル要求分類
- Authors: Waleed Abdeen, Michael Unterkalmsteiner, Krzysztof Wnuk, Alexandros Chirtoglou, Christoph Schimanski, Heja Goli,
- Abstract要約: 大規模ラベルによる多ラベル要求分類は、要求のトレーサビリティを補助するが、教師付きトレーニングでは違法にコストがかかる。
私たちは129の要件を,250から1183のクラスから769のラベルに関連付けました。
文ベース分類は単語ベース分類と比較して有意に高いリコール率を示した。
階層的な分類戦略は要求分類の性能を必ずしも改善しなかった。
- 参考スコア(独自算出の注目度): 40.588683959176116
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Classification aids software development activities by organizing requirements in classes for easier access and retrieval. The majority of requirements classification research has, so far, focused on binary or multi-class classification. Multi-label classification with large taxonomies could aid requirements traceability but is prohibitively costly with supervised training. Hence, we investigate zero-short learning to evaluate the feasibility of multi-label requirements classification with large taxonomies. We associated, together with domain experts from the industry, 129 requirements with 769 labels from taxonomies ranging between 250 and 1183 classes. Then, we conducted a controlled experiment to study the impact of the type of classifier, the hierarchy, and the structural characteristics of taxonomies on the classification performance. The results show that: (1) The sentence-based classifier had a significantly higher recall compared to the word-based classifier; however, the precision and F1-score did not improve significantly. (2) The hierarchical classification strategy did not always improve the performance of requirements classification. (3) The total and leaf nodes of the taxonomies have a strong negative correlation with the recall of the hierarchical sentence-based classifier. We investigate the problem of multi-label requirements classification with large taxonomies, illustrate a systematic process to create a ground truth involving industry participants, and provide an analysis of different classification pipelines using zero-shot learning.
- Abstract(参考訳): 分類は、アクセスと検索を容易にするためにクラス内の要求を整理することで、ソフトウェア開発活動を支援する。
要求分類研究の大部分は、これまでのところバイナリ分類やマルチクラス分類に重点を置いている。
大きく分類された多ラベル分類は、要求のトレーサビリティを助長するが、教師付きトレーニングでは違法にコストがかかる。
そこで本研究では,ゼロショート学習を用いて,大規模分類を用いたマルチラベル要求分類の実現可能性について検討する。
業界の専門家らとともに,250~1183の分類群から769のラベルを持つ129の要件について検討した。
そこで,分類器の種類,階層構造,分類特性が分類性能に及ぼす影響について検討した。
その結果,(1) 文ベース分類器は単語ベース分類器に比べて有意に高いリコール率を示したが,精度とF1スコアは改善しなかった。
2)階層的分類戦略は要求分類の性能を必ずしも改善しなかった。
(3) 分類学の総ノードと葉ノードは,階層型文ベース分類器のリコールと負の相関が強い。
本研究では,大規模な分類学による多言語要件分類の問題について検討し,業界参加者による根本的真理の体系的プロセスを示し,ゼロショット学習を用いた異なる分類パイプラインの分析を行った。
関連論文リスト
- Hierarchical Query Classification in E-commerce Search [38.67034103433015]
電子商取引プラットフォームは通常、製品情報と検索データを階層構造に保存し、構造化する。
ユーザ検索クエリを同様の階層構造に効果的に分類することは,eコマースプラットフォーム上でのユーザエクスペリエンスの向上,ニュースキュレーションや学術研究において最重要である。
階層的問合せ分類の本質的な複雑さは,(1)支配的カテゴリに傾倒する顕著なクラス不均衡,(2)正確な分類を妨げる検索クエリの本質的簡潔さとあいまいさの2つの課題によって複雑化されている。
論文 参考訳(メタデータ) (2024-03-09T21:55:55Z) - TaxoKnow: Taxonomy as Prior Knowledge in the Loss Function of
Multi-class Classification [1.130757825611188]
本稿では,学習アルゴリズムの損失関数に,階層型分類を明示的正規化器として統合する2つの方法を紹介する。
階層的な分類法により、ニューラルネットワークはクラス上の出力分布を緩和し、少数クラスの上位概念を条件付けする。
論文 参考訳(メタデータ) (2023-05-24T08:08:56Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Semi-Supervised Learning with Taxonomic Labels [42.02670649470055]
細粒度領域で画像分類器を訓練するために,粗い分類ラベルを組み込む手法を提案する。
3つの王国にまたがる810種からなるSemi-iNatデータセットでは、フィラムラベルを組み込むことで、種レベルの分類精度が6%向上する。
本稿では,階層構造に導かれる未ラベル画像の集合から,ロバスト性を改善するための関連データを選択する手法を提案する。
論文 参考訳(メタデータ) (2021-11-23T00:50:25Z) - Inducing a hierarchy for multi-class classification problems [11.58041597483471]
分類的ラベルが自然な階層に従ったアプリケーションでは、ラベル構造を利用する分類方法は、そうでないものをしばしば上回る。
本稿では,フラット分類器に対する分類性能を向上できる階層構造を誘導する手法のクラスについて検討する。
原理シミュレーションと3つの実データアプリケーションにおいて、潜入階層の発見と精度向上のためのメソッドのクラスの有効性を実証する。
論文 参考訳(メタデータ) (2021-02-20T05:40:42Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Classification with Rejection Based on Cost-sensitive Classification [83.50402803131412]
学習のアンサンブルによる拒絶を用いた新しい分類法を提案する。
実験により, クリーン, ノイズ, 正の未ラベル分類における提案手法の有用性が示された。
論文 参考訳(メタデータ) (2020-10-22T14:05:05Z) - Cooperative Bi-path Metric for Few-shot Learning [50.98891758059389]
数発の分類問題の調査に2つの貢献をしている。
本稿では,従来の教師あり学習法において,ベースクラスで訓練されたシンプルで効果的なベースラインについて報告する。
本稿では, 基礎クラスと新しいクラス間の相関を利用して, 精度の向上を図る, 分類のための協調的二経路計量を提案する。
論文 参考訳(メタデータ) (2020-08-10T11:28:52Z) - Joint Embedding of Words and Category Labels for Hierarchical
Multi-label Text Classification [4.2750700546937335]
階層的テキスト分類(HTC)は広く注目されており、幅広い応用の見通しがある。
本稿では,HTC の階層的微調整順序ニューロン LSTM (HFT-ONLSTM) に基づくテキストと親カテゴリの結合埋め込みを提案する。
論文 参考訳(メタデータ) (2020-04-06T11:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。