論文の概要: Cost-Sensitive Stacking: an Empirical Evaluation
- arxiv url: http://arxiv.org/abs/2301.01748v1
- Date: Wed, 4 Jan 2023 18:28:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 15:48:56.098536
- Title: Cost-Sensitive Stacking: an Empirical Evaluation
- Title(参考訳): コスト感受性の積み重ね:実証的な評価
- Authors: Natalie Lawrance and Marie-Anne Guerry and George Petrides
- Abstract要約: コスト感受性学習は、誤分類コストの違いを考慮に入れた分類アルゴリズムに適応する。
コストに敏感なスタックとは何か、という文献には意見の一致がない。
実験は12のデータセットを用いて行われ、最高の性能を得るためには、どちらのレベルの積み重ねもコストに敏感な分類決定を必要とすることを示した。
- 参考スコア(独自算出の注目度): 3.867363075280544
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many real-world classification problems are cost-sensitive in nature, such
that the misclassification costs vary between data instances. Cost-sensitive
learning adapts classification algorithms to account for differences in
misclassification costs. Stacking is an ensemble method that uses predictions
from several classifiers as the training data for another classifier, which in
turn makes the final classification decision.
While a large body of empirical work exists where stacking is applied in
various domains, very few of these works take the misclassification costs into
account. In fact, there is no consensus in the literature as to what
cost-sensitive stacking is. In this paper we perform extensive experiments with
the aim of establishing what the appropriate setup for a cost-sensitive
stacking ensemble is. Our experiments, conducted on twelve datasets from a
number of application domains, using real, instance-dependent misclassification
costs, show that for best performance, both levels of stacking require
cost-sensitive classification decision.
- Abstract(参考訳): 多くの現実世界の分類問題は、データインスタンス間で誤分類コストが異なるため、本質的にコストに敏感である。
コスト感受性学習は、誤分類コストの違いを考慮に入れた分類アルゴリズムに適応する。
Stackingは、複数の分類器からの予測を別の分類器のトレーニングデータとして使用するアンサンブル手法で、最終的な分類決定を行う。
様々な領域に積み重ねが適用されるような経験的作業が多数存在するが、これらの作業の中で誤分類コストを考慮に入れるものはごくわずかである。
実際、コストに敏感なスタックとは何かという文献には合意がない。
本稿では,コストに敏感なスタックングアンサンブルの適切なセットアップを確立するために,広範な実験を行う。
実例に依存しない誤分類コストを用いて,複数のアプリケーションドメインから12のデータセットを用いて実施した本実験は,最高の性能を示すためには,いずれのレベルも,コストに敏感な分類決定を必要とすることを示す。
関連論文リスト
- Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Cost-Accuracy Aware Adaptive Labeling for Active Learning [9.761953860259942]
多くの実環境において、異なるラベルには異なるラベルのコストがあり、異なるラベルの精度が得られる。
本稿では, インスタンス, ラベル付け者と対応するコストを選択し, ラベル付け精度を向上するための新しいアルゴリズムを提案する。
提案アルゴリズムは,5つのUCIおよび実際のクラウドソーシングデータセット上での最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2021-05-24T17:21:00Z) - Cost-Based Budget Active Learning for Deep Learning [0.9732863739456035]
予算に制約のある集団における分類の不確実性やインスタンスの多様性を考慮したコストベースのバグデットアクティブラーニング(CBAL)を提案する。
min-maxに基づく原則的アプローチは、選択されたインスタンスのラベル付けと決定コストを最小化すると考えられる。
論文 参考訳(メタデータ) (2020-12-09T17:42:44Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Classification with Rejection Based on Cost-sensitive Classification [83.50402803131412]
学習のアンサンブルによる拒絶を用いた新しい分類法を提案する。
実験により, クリーン, ノイズ, 正の未ラベル分類における提案手法の有用性が示された。
論文 参考訳(メタデータ) (2020-10-22T14:05:05Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - Misclassification cost-sensitive ensemble learning: A unifying framework [7.90398448280017]
私たちのコントリビューションは、コストに敏感なアンサンブルメソッドに関する包括的で洞察に富んだ概要を提供する統一フレームワークです。
私たちのフレームワークには、AdaBoost、Bagging、Random Forestなど、メソッド間の自然な拡張とアイデアの一般化が含まれています。
論文 参考訳(メタデータ) (2020-07-14T21:18:33Z) - Global Multiclass Classification and Dataset Construction via
Heterogeneous Local Experts [37.27708297562079]
得られたデータセットの信頼性を確保しながら、ラベルの数を最小化する方法を示す。
MNISTとCIFAR-10データセットを用いた実験では、アグリゲーション方式の良好な精度が示されている。
論文 参考訳(メタデータ) (2020-05-21T18:07:42Z) - Angle-Based Cost-Sensitive Multicategory Classification [34.174072286426885]
本稿では,ゼロ対ゼロの制約を伴わない多カテゴリ分類のための,新しいアングルに基づくコスト依存分類フレームワークを提案する。
このフレームワークの有用性を示すために、2つのコスト依存型マルチカテゴリブースティングアルゴリズムを具体例として導出した。
論文 参考訳(メタデータ) (2020-03-08T00:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。