論文の概要: Beyond Rebalancing: Benchmarking Binary Classifiers Under Class Imbalance Without Rebalancing Techniques
- arxiv url: http://arxiv.org/abs/2509.07605v1
- Date: Tue, 09 Sep 2025 11:28:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:27.281823
- Title: Beyond Rebalancing: Benchmarking Binary Classifiers Under Class Imbalance Without Rebalancing Techniques
- Title(参考訳): リバランシングを超えて: 再バランシングテクニックを使わずに、クラス不均衡の下でバイナリ分類器をベンチマークする
- Authors: Ali Nawaz, Amir Ahmad, Shehroz S. Khan,
- Abstract要約: クラス不均衡は、特に医学診断や異常検出といった重要な領域において、教師付き分類にとって重要な課題である。
実世界のデータセットと合成データセットの両方にまたがる多様なバイナリ分類器の頑健さを体系的に評価する。
その結果、データの複雑さが増加し、マイノリティクラスのサイズが減少するにつれて、分類がより困難になることが確認された。
- 参考スコア(独自算出の注目度): 3.7660066212240744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Class imbalance poses a significant challenge to supervised classification, particularly in critical domains like medical diagnostics and anomaly detection where minority class instances are rare. While numerous studies have explored rebalancing techniques to address this issue, less attention has been given to evaluating the performance of binary classifiers under imbalance when no such techniques are applied. Therefore, the goal of this study is to assess the performance of binary classifiers "as-is", without performing any explicit rebalancing. Specifically, we systematically evaluate the robustness of a diverse set of binary classifiers across both real-world and synthetic datasets, under progressively reduced minority class sizes, using one-shot and few-shot scenarios as baselines. Our approach also explores varying data complexities through synthetic decision boundary generation to simulate real-world conditions. In addition to standard classifiers, we include experiments using undersampling, oversampling strategies, and one-class classification (OCC) methods to examine their behavior under severe imbalance. The results confirm that classification becomes more difficult as data complexity increases and the minority class size decreases. While traditional classifiers deteriorate under extreme imbalance, advanced models like TabPFN and boosting-based ensembles retain relatively higher performance and better generalization compared to traditional classifiers. Visual interpretability and evaluation metrics further validate these findings. Our work offers valuable guidance on model selection for imbalanced learning, providing insights into classifier robustness without dependence on explicit rebalancing techniques.
- Abstract(参考訳): クラス不均衡は、特に少数クラスのインスタンスが稀な医学診断や異常検出のような重要な領域において、教師付き分類にとって重要な課題である。
この問題に対処するために多くの研究が再バランス手法を探求してきたが、そのような手法を適用しない場合のバイナリ分類器の性能評価にはあまり注意が払われていない。
そこで本研究の目的は,2値分類器の「as-is」の性能を明示的再バランスを伴わずに評価することである。
具体的には、実世界のデータセットと合成データセットの両方にまたがる多様なバイナリ分類器のロバスト性について、ワンショットと少数ショットのシナリオをベースラインとして、徐々に少数クラスのサイズを減らし、体系的に評価する。
提案手法では, 実世界の条件をシミュレートするために, 合成決定境界生成による様々なデータ複雑度についても検討する。
標準分類器に加えて, アンダーサンプリング, オーバーサンプリング戦略, ワンクラス分類法(OCC)を用いて, 厳密な不均衡下での動作を調べる実験も含んでいる。
その結果、データ複雑性が増加し、マイノリティクラスのサイズが減少するにつれて、分類がより困難になることを確認した。
従来の分類器は極端に不均衡な状態では劣化するが、TabPFNやブースティングベースのアンサンブルのような高度なモデルは従来の分類器に比べて比較的高い性能と一般化を維持している。
視覚的解釈可能性と評価指標は、これらの発見をさらに検証する。
我々の研究は、不均衡学習のためのモデル選択に関する貴重なガイダンスを提供し、明示的な再バランス技術に頼ることなく、分類器の堅牢性に関する洞察を提供する。
関連論文リスト
- Kernel-Free Universum Quadratic Surface Twin Support Vector Machines for Imbalanced Data [1.8990839669542954]
不均衡なクラスを持つバイナリ分類タスクは、機械学習において大きな課題となる。
本稿では,2次双立サポートベクトルマシンモデル内のマイノリティクラスをサポートするためにUniversumポイントを活用することで,この問題に対処する新しいアプローチを提案する。
本手法は,Universumの点を組み込むことで,不均衡なデータセットの分類精度と一般化性能を向上させる。
論文 参考訳(メタデータ) (2024-12-02T19:57:59Z) - Rethinking Classifier Re-Training in Long-Tailed Recognition: A Simple
Logits Retargeting Approach [102.0769560460338]
我々は,クラスごとのサンプル数に関する事前知識を必要とせず,シンプルなロジットアプローチ(LORT)を開発した。
提案手法は,CIFAR100-LT, ImageNet-LT, iNaturalist 2018など,様々な不均衡データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-01T03:27:08Z) - Deep Imbalanced Regression via Hierarchical Classification Adjustment [50.19438850112964]
コンピュータビジョンにおける回帰タスクは、しばしば、対象空間をクラスに定量化することで分類される。
トレーニングサンプルの大多数は目標値の先頭にあるが、少数のサンプルは通常より広い尾幅に分布する。
不均衡回帰タスクを解くために階層型分類器を構築することを提案する。
不均衡回帰のための新しい階層型分類調整(HCA)は,3つのタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2023-10-26T04:54:39Z) - A Unified Generalization Analysis of Re-Weighting and Logit-Adjustment
for Imbalanced Learning [129.63326990812234]
そこで本研究では,データ依存型コンダクタンス(Data-dependent contraction)と呼ばれる手法を提案する。
この技術に加えて、不均衡学習のための微粒な一般化境界が確立され、再重み付けとロジット調整の謎を明らかにするのに役立つ。
論文 参考訳(メタデータ) (2023-10-07T09:15:08Z) - Class-Imbalanced Complementary-Label Learning via Weighted Loss [8.934943507699131]
補完ラベル学習(Complementary-label Learning, CLL)は、弱い教師付き分類において広く用いられている。
クラス不均衡のトレーニングサンプルに直面すると、現実世界のデータセットでは大きな課題に直面します。
多クラス分類のためのクラス不均衡補完ラベルからの学習を可能にする新しい問題設定を提案する。
論文 参考訳(メタデータ) (2022-09-28T16:02:42Z) - Imbalanced Classification via a Tabular Translation GAN [4.864819846886142]
本稿では,多数のサンプルを対応する合成マイノリティ標本にマッピングするために,新たな正規化損失を用いたジェネレーティブ・アドバイサル・ネットワークに基づくモデルを提案する。
提案手法は, 再加重法やオーバーサンプリング法と比較して, 平均精度を向上することを示す。
論文 参考訳(メタデータ) (2022-04-19T06:02:53Z) - Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。
プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。
我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文 参考訳(メタデータ) (2021-10-22T01:55:01Z) - An Empirical Study on the Joint Impact of Feature Selection and Data
Resampling on Imbalance Classification [4.506770920842088]
本研究では,不均衡分類のための特徴選択とデータ再サンプリングの相乗性に着目した。
9つの特徴選択手法、クラス不均衡学習のための6つの再サンプリング手法、および3つのよく知られた分類アルゴリズムを用いて、52の公開データセットに対して多数の実験を行った。
論文 参考訳(メタデータ) (2021-09-01T06:01:51Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z) - M2m: Imbalanced Classification via Major-to-minor Translation [79.09018382489506]
ほとんどの実世界のシナリオでは、ラベル付きトレーニングデータセットは非常にクラス不均衡であり、ディープニューラルネットワークは、バランスの取れたテスト基準への一般化に苦しむ。
本稿では,より頻度の低いクラスを,より頻度の低いクラスからのサンプルを翻訳することによって,この問題を緩和する新しい方法を提案する。
提案手法は,従来の再サンプリング法や再重み付け法と比較して,マイノリティクラスの一般化を著しく改善することを示す。
論文 参考訳(メタデータ) (2020-04-01T13:21:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。