論文の概要: Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means
Clustering and Minimum Interlayer discrepancy
- arxiv url: http://arxiv.org/abs/2111.01371v1
- Date: Tue, 2 Nov 2021 04:59:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-03 14:10:39.567745
- Title: Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means
Clustering and Minimum Interlayer discrepancy
- Title(参考訳): 多層ファジィC平均クラスタリングと最小層間誤差に基づくエンベロープ不均衡学習アルゴリズム
- Authors: Fan Li, Xiaoheng Zhang, Pin Wang, Yongming Li
- Abstract要約: 本稿では,マルチ層ファジィc-means(MlFCM)と最小層間離散化機構(MIDMD)を用いたディープインスタンスエンベロープネットワークに基づく不均衡学習アルゴリズムを提案する。
このアルゴリズムは、事前の知識がなければ、ディープインスタンスエンベロープネットワークを使用して、高品質なバランスの取れたインスタンスを保証できる。
- 参考スコア(独自算出の注目度): 14.339674126923903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imbalanced learning is important and challenging since the problem of the
classification of imbalanced datasets is prevalent in machine learning and data
mining fields. Sampling approaches are proposed to address this issue, and
cluster-based oversampling methods have shown great potential as they aim to
simultaneously tackle between-class and within-class imbalance issues. However,
all existing clustering methods are based on a one-time approach. Due to the
lack of a priori knowledge, improper setting of the number of clusters often
exists, which leads to poor clustering performance. Besides, the existing
methods are likely to generate noisy instances. To solve these problems, this
paper proposes a deep instance envelope network-based imbalanced learning
algorithm with the multilayer fuzzy c-means (MlFCM) and a minimum interlayer
discrepancy mechanism based on the maximum mean discrepancy (MIDMD). This
algorithm can guarantee high quality balanced instances using a deep instance
envelope network in the absence of prior knowledge. In the experimental
section, thirty-three popular public datasets are used for verification, and
over ten representative algorithms are used for comparison. The experimental
results show that the proposed approach significantly outperforms other popular
methods.
- Abstract(参考訳): 不均衡なデータセットの分類の問題が機械学習やデータマイニングの分野に広まっているため、不均衡な学習は重要かつ困難である。
この問題を解決するためにサンプリングアプローチが提案されており、クラスタベースのオーバーサンプリング手法はクラス間およびクラス内不均衡問題を同時に取り組もうとしているため、大きな可能性を秘めている。
しかしながら、既存のクラスタリングメソッドはすべて、ワンタイムアプローチに基づいている。
事前知識の欠如により、クラスタ数の不適切な設定がしばしば発生し、クラスタのパフォーマンスが低下する。
さらに、既存のメソッドは騒がしいインスタンスを生成する可能性が高い。
そこで本研究では,多層ファジィc-means (mlfcm) を用いたディープインスタンス包絡ネットワークに基づく不均衡学習アルゴリズムと,最大平均偏差 (midmd) に基づく最小層間不一致機構を提案する。
このアルゴリズムは、事前の知識がなければ、ディープインスタンスエンベロープネットワークを使用して、高品質なバランスの取れたインスタンスを保証できる。
実験セクションでは、検証には33の人気のある公開データセットが使用され、比較には10以上の代表アルゴリズムが使用される。
実験の結果,提案手法が他の一般的な手法を大きく上回っていることがわかった。
関連論文リスト
- Robust and Automatic Data Clustering: Dirichlet Process meets
Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Research on Efficient Fuzzy Clustering Method Based on Local Fuzzy
Granular balls [67.33923111887933]
本稿では,データをグラニュラーボールを用いてファジィにイテレーションし,その位置にある2つのグラニュラーボールのみをデータのメンバーシップ度として検討する。
ファジィグラニュラーボールセットは、異なるデータシナリオに直面して、より多くの処理方法を使用することができる。
論文 参考訳(メタデータ) (2023-03-07T01:52:55Z) - Overlapping oriented imbalanced ensemble learning method based on
projective clustering and stagewise hybrid sampling [22.32930261633615]
本稿では、二重クラスタリングとステージワイドハイブリッドサンプリング(DCSHS)に基づくアンサンブル学習アルゴリズムを提案する。
我々のアルゴリズムの大きな利点は、重なり合う多数サンプルのソフトな除去を実現するためにCSの交叉性を利用することができることである。
論文 参考訳(メタデータ) (2022-11-30T01:49:06Z) - An Instance Selection Algorithm for Big Data in High imbalanced datasets
based on LSH [0.0]
機械学習モデルを実環境で訓練することは、しばしば、関心のクラスが表現されていないビッグデータや不均衡なサンプルを扱う。
本研究は,大規模かつ不均衡なデータセットを扱うために,例選択(IS)という3つの新しい手法を提案する。
アルゴリズムはApache Sparkフレームワークで開発され、スケーラビリティが保証された。
論文 参考訳(メタデータ) (2022-10-09T17:38:41Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Learning Statistical Representation with Joint Deep Embedded Clustering [2.1267423178232407]
StatDECは、共同統計表現学習とクラスタリングのための教師なしのフレームワークである。
実験により,これらの表現を用いることで,様々な画像データセットにまたがる不均衡な画像クラスタリングの結果を大幅に改善できることが示された。
論文 参考訳(メタデータ) (2021-09-11T09:26:52Z) - Unsupervised Clustered Federated Learning in Complex Multi-source
Acoustic Environments [75.8001929811943]
現実的で挑戦的なマルチソース・マルチルーム音響環境を導入する。
本稿では,音響シーンの変動を考慮したクラスタリング制御手法を提案する。
提案手法はクラスタリングに基づく測度を用いて最適化され,ネットワークワイド分類タスクによって検証される。
論文 参考訳(メタデータ) (2021-06-07T14:51:39Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Combined Cleaning and Resampling Algorithm for Multi-Class Imbalanced
Data with Label Noise [11.868507571027626]
本稿では,新しいオーバーサンプリング手法であるマルチクラス・コンバインド・クリーニングとリサンプリングのアルゴリズムを提案する。
提案手法は, オーバーサンプリングに適した領域をモデル化するためのエネルギーベース手法を用いて, SMOTEよりも小さな解離や外れ値の影響を受けない。
重なり合うクラス分布が学習アルゴリズムの性能に与える影響を低減することを目的として, 同時クリーニング操作と組み合わせた。
論文 参考訳(メタデータ) (2020-04-07T13:59:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。