論文の概要: IMOVNO+: A Regional Partitioning and Meta-Heuristic Ensemble Framework for Imbalanced Multi-Class Learning
- arxiv url: http://arxiv.org/abs/2602.20199v1
- Date: Sun, 22 Feb 2026 08:13:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-25 17:34:53.460052
- Title: IMOVNO+: A Regional Partitioning and Meta-Heuristic Ensemble Framework for Imbalanced Multi-Class Learning
- Title(参考訳): IMOVNO+:非バランスなマルチクラス学習のための地域分割とメタヒューリスティックアンサンブルフレームワーク
- Authors: Soufiane Bacha, Laouni Djafri, Sahraoui Dhelim, Huansheng Ning,
- Abstract要約: クラス不均衡、重複、ノイズによりデータ品質が低下し、モデルの信頼性が低下し、一般化が制限される。
本稿では,データ品質とアルゴリズム的ロバスト性を向上させるためのフレームワークであるIMOVNO+を提案する。
その結果、最先端手法よりも一貫した優位性を示し、いくつかのケースでは100%に近づいた。
- 参考スコア(独自算出の注目度): 5.693705818399956
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Class imbalance, overlap, and noise degrade data quality, reduce model reliability, and limit generalization. Although widely studied in binary classification, these issues remain underexplored in multi-class settings, where complex inter-class relationships make minority-majority structures unclear and traditional clustering fails to capture distribution shape. Approaches that rely only on geometric distances risk removing informative samples and generating low-quality synthetic data, while binarization approaches treat imbalance locally and ignore global inter-class dependencies. At the algorithmic level, ensembles struggle to integrate weak classifiers, leading to limited robustness. This paper proposes IMOVNO+ (IMbalance-OVerlap-NOise+ Algorithm-Level Optimization), a two-level framework designed to jointly enhance data quality and algorithmic robustness for binary and multi-class tasks. At the data level, first, conditional probability is used to quantify the informativeness of each sample. Second, the dataset is partitioned into core, overlapping, and noisy regions. Third, an overlapping-cleaning algorithm is introduced that combines Z-score metrics with a big-jump gap distance. Fourth, a smart oversampling algorithm based on multi-regularization controls synthetic sample proximity, preventing new overlaps. At the algorithmic level, a meta-heuristic prunes ensemble classifiers to reduce weak-learner influence. IMOVNO+ was evaluated on 35 datasets (13 multi-class, 22 binary). Results show consistent superiority over state-of-the-art methods, approaching 100% in several cases. For multi-class data, IMOVNO+ achieves gains of 37-57% in G-mean, 25-44% in F1-score, 25-39% in precision, and 26-43% in recall. In binary tasks, it attains near-perfect performance with improvements of 14-39%. The framework handles data scarcity and imbalance from collection and privacy limits.
- Abstract(参考訳): クラス不均衡、重複、ノイズによりデータ品質が低下し、モデルの信頼性が低下し、一般化が制限される。
バイナリ分類では広く研究されているが、これらの問題は多クラス間の複雑な関係がマイノリティ・マジョリティ構造を不明瞭にし、従来のクラスタリングでは分布形態を捉えられず、いまだに探索されていない。
幾何学的距離のみに依存するアプローチは、情報的サンプルを除去し、低品質の合成データを生成するリスクを負う一方、双項化アプローチは局所的に不均衡を扱い、グローバルなクラス間の依存関係を無視する。
アルゴリズムレベルでは、アンサンブルは弱い分類器を統合するのに苦労し、頑丈さは制限される。
IMOVNO+(IM Balance-OVerlap-Noise+ Algorithm-Level Optimization)は,データ品質とマルチクラスタスクに対するアルゴリズム的ロバスト性を両立する2段階のフレームワークである。
データレベルでは、まず、各サンプルの情報度を定量化するために条件付き確率が使用される。
次に、データセットをコア、オーバーラップ、ノイズの多いリージョンに分割する。
第3に、Zスコアメトリクスとビッグジャンプギャップ距離を組み合わせたオーバーラップクリーニングアルゴリズムが導入された。
第4に、多正規化に基づくスマートオーバーサンプリングアルゴリズムは、合成サンプル近接を制御し、新しいオーバーラップを防ぐ。
アルゴリズムレベルでは、メタヒューリスティックなプルーンアンサンブル分類器は弱いラーナーの影響を減らす。
IMOVNO+は35のデータセット(13のマルチクラス、22のバイナリ)で評価された。
その結果、最先端手法よりも一貫した優位性を示し、いくつかのケースでは100%に近づいた。
マルチクラスのデータでは、IMOVNO+はG平均37-57%、F1スコア25-44%、精度25-39%、リコール26-43%のゲインを達成している。
バイナリタスクでは、14~39%の改善でほぼ完全なパフォーマンスを実現している。
このフレームワークはデータの不足を処理し、コレクションとプライバシの制限から不均衡を解消する。
関連論文リスト
- Unbiased Max-Min Embedding Classification for Transductive Few-Shot Learning: Clustering and Classification Are All You Need [83.10178754323955]
わずかなショットラーニングにより、モデルがいくつかのラベル付き例から一般化できる。
本稿では,Unbiased Max-Min Embedding Classification (UMMEC)法を提案する。
本手法は最小ラベル付きデータを用いて分類性能を著しく向上させ, 注釈付きLの最先端化を推し進める。
論文 参考訳(メタデータ) (2025-03-28T07:23:07Z) - Neighbor displacement-based enhanced synthetic oversampling for multiclass imbalanced data [0.0]
不均衡なマルチクラスデータセットは、機械学習アルゴリズムに課題を提起する。
既存のメソッドはまだスパースデータに悩まされており、元のデータパターンを正確に表現していない可能性がある。
本稿では,NDESO(Nighbor Displacement-based Enhanced Synthetic Oversampling)と呼ばれるハイブリッド手法を提案する。
論文 参考訳(メタデータ) (2025-01-07T19:15:00Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Overlapping oriented imbalanced ensemble learning method based on
projective clustering and stagewise hybrid sampling [22.32930261633615]
本稿では、二重クラスタリングとステージワイドハイブリッドサンプリング(DCSHS)に基づくアンサンブル学習アルゴリズムを提案する。
我々のアルゴリズムの大きな利点は、重なり合う多数サンプルのソフトな除去を実現するためにCSの交叉性を利用することができることである。
論文 参考訳(メタデータ) (2022-11-30T01:49:06Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means
Clustering and Minimum Interlayer discrepancy [14.339674126923903]
本稿では,マルチ層ファジィc-means(MlFCM)と最小層間離散化機構(MIDMD)を用いたディープインスタンスエンベロープネットワークに基づく不均衡学習アルゴリズムを提案する。
このアルゴリズムは、事前の知識がなければ、ディープインスタンスエンベロープネットワークを使用して、高品質なバランスの取れたインスタンスを保証できる。
論文 参考訳(メタデータ) (2021-11-02T04:59:57Z) - Benign Overfitting in Multiclass Classification: All Roads Lead to
Interpolation [39.02017410837255]
多クラス線形分類における良性オーバーフィッティングについて検討する。
分離可能なデータに対する以下のトレーニングアルゴリズムを検討する。
MNI分類器の精度に基づいた新しい境界を導出する。
論文 参考訳(メタデータ) (2021-06-21T05:34:36Z) - PLM: Partial Label Masking for Imbalanced Multi-label Classification [59.68444804243782]
長いラベルの分布を持つ実世界のデータセットで訓練されたニューラルネットワークは、頻繁なクラスに偏りがあり、頻繁なクラスでは不十分である。
本稿では,この比率を利用したPLM(Partial Label Masking)を提案する。
本手法は,マルチラベル (MultiMNIST と MSCOCO) とシングルラベル (CIFAR-10 と CIFAR-100) の2つの画像分類データセットにおいて,既存の手法と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2021-05-22T18:07:56Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Combined Cleaning and Resampling Algorithm for Multi-Class Imbalanced
Data with Label Noise [11.868507571027626]
本稿では,新しいオーバーサンプリング手法であるマルチクラス・コンバインド・クリーニングとリサンプリングのアルゴリズムを提案する。
提案手法は, オーバーサンプリングに適した領域をモデル化するためのエネルギーベース手法を用いて, SMOTEよりも小さな解離や外れ値の影響を受けない。
重なり合うクラス分布が学習アルゴリズムの性能に与える影響を低減することを目的として, 同時クリーニング操作と組み合わせた。
論文 参考訳(メタデータ) (2020-04-07T13:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。