Fugu-MT 論文翻訳(概要): Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means Clustering and Minimum Interlayer discrepancy

論文の概要: Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means Clustering and Minimum Interlayer discrepancy

arxiv url: http://arxiv.org/abs/2111.01371v1
Date: Tue, 2 Nov 2021 04:59:57 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-03 14:10:39.567745
Title: Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means Clustering and Minimum Interlayer discrepancy
Title（参考訳）: 多層ファジィC平均クラスタリングと最小層間誤差に基づくエンベロープ不均衡学習アルゴリズム
Authors: Fan Li, Xiaoheng Zhang, Pin Wang, Yongming Li
Abstract要約: 本稿では,マルチ層ファジィc-means(MlFCM)と最小層間離散化機構(MIDMD)を用いたディープインスタンスエンベロープネットワークに基づく不均衡学習アルゴリズムを提案する。このアルゴリズムは、事前の知識がなければ、ディープインスタンスエンベロープネットワークを使用して、高品質なバランスの取れたインスタンスを保証できる。
参考スコア（独自算出の注目度）: 14.339674126923903
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Imbalanced learning is important and challenging since the problem of the classification of imbalanced datasets is prevalent in machine learning and data mining fields. Sampling approaches are proposed to address this issue, and cluster-based oversampling methods have shown great potential as they aim to simultaneously tackle between-class and within-class imbalance issues. However, all existing clustering methods are based on a one-time approach. Due to the lack of a priori knowledge, improper setting of the number of clusters often exists, which leads to poor clustering performance. Besides, the existing methods are likely to generate noisy instances. To solve these problems, this paper proposes a deep instance envelope network-based imbalanced learning algorithm with the multilayer fuzzy c-means (MlFCM) and a minimum interlayer discrepancy mechanism based on the maximum mean discrepancy (MIDMD). This algorithm can guarantee high quality balanced instances using a deep instance envelope network in the absence of prior knowledge. In the experimental section, thirty-three popular public datasets are used for verification, and over ten representative algorithms are used for comparison. The experimental results show that the proposed approach significantly outperforms other popular methods.
Abstract（参考訳）: 不均衡なデータセットの分類の問題が機械学習やデータマイニングの分野に広まっているため、不均衡な学習は重要かつ困難である。この問題を解決するためにサンプリングアプローチが提案されており、クラスタベースのオーバーサンプリング手法はクラス間およびクラス内不均衡問題を同時に取り組もうとしているため、大きな可能性を秘めている。しかしながら、既存のクラスタリングメソッドはすべて、ワンタイムアプローチに基づいている。事前知識の欠如により、クラスタ数の不適切な設定がしばしば発生し、クラスタのパフォーマンスが低下する。さらに、既存のメソッドは騒がしいインスタンスを生成する可能性が高い。そこで本研究では,多層ファジィc-means (mlfcm) を用いたディープインスタンス包絡ネットワークに基づく不均衡学習アルゴリズムと,最大平均偏差 (midmd) に基づく最小層間不一致機構を提案する。このアルゴリズムは、事前の知識がなければ、ディープインスタンスエンベロープネットワークを使用して、高品質なバランスの取れたインスタンスを保証できる。実験セクションでは、検証には33の人気のある公開データセットが使用され、比較には10以上の代表アルゴリズムが使用される。実験の結果,提案手法が他の一般的な手法を大きく上回っていることがわかった。

関連論文リスト

Average Sensitivity of Hierarchical $k$-Median Clustering [9.107341310040155]
階層的およびセントロイドベースのクラスタリングを橋渡しする階層的$k$-medianクラスタリング問題に焦点を当てる。階層的な$k$-medianクラスタリングのための効率的なアルゴリズムを提案し,その平均感度とクラスタリング品質を理論的に証明する。
論文参考訳（メタデータ） (2025-07-14T14:02:31Z)
Unbiased Max-Min Embedding Classification for Transductive Few-Shot Learning: Clustering and Classification Are All You Need [83.10178754323955]
わずかなショットラーニングにより、モデルがいくつかのラベル付き例から一般化できる。本稿では,Unbiased Max-Min Embedding Classification (UMMEC)法を提案する。本手法は最小ラベル付きデータを用いて分類性能を著しく向上させ, 注釈付きLの最先端化を推し進める。
論文参考訳（メタデータ） (2025-03-28T07:23:07Z)
Robust and Automatic Data Clustering: Dirichlet Process meets Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文参考訳（メタデータ） (2023-11-26T19:01:15Z)
Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文参考訳（メタデータ） (2023-08-28T18:48:34Z)
Research on Efficient Fuzzy Clustering Method Based on Local Fuzzy Granular balls [67.33923111887933]
本稿では,データをグラニュラーボールを用いてファジィにイテレーションし,その位置にある2つのグラニュラーボールのみをデータのメンバーシップ度として検討する。ファジィグラニュラーボールセットは、異なるデータシナリオに直面して、より多くの処理方法を使用することができる。
論文参考訳（メタデータ） (2023-03-07T01:52:55Z)
Overlapping oriented imbalanced ensemble learning method based on projective clustering and stagewise hybrid sampling [22.32930261633615]
本稿では、二重クラスタリングとステージワイドハイブリッドサンプリング(DCSHS)に基づくアンサンブル学習アルゴリズムを提案する。我々のアルゴリズムの大きな利点は、重なり合う多数サンプルのソフトな除去を実現するためにCSの交叉性を利用することができることである。
論文参考訳（メタデータ） (2022-11-30T01:49:06Z)
An Instance Selection Algorithm for Big Data in High imbalanced datasets based on LSH [0.0]
機械学習モデルを実環境で訓練することは、しばしば、関心のクラスが表現されていないビッグデータや不均衡なサンプルを扱う。本研究は,大規模かつ不均衡なデータセットを扱うために,例選択(IS)という3つの新しい手法を提案する。アルゴリズムはApache Sparkフレームワークで開発され、スケーラビリティが保証された。
論文参考訳（メタデータ） (2022-10-09T17:38:41Z)
Rethinking Clustering-Based Pseudo-Labeling for Unsupervised Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文参考訳（メタデータ） (2022-09-27T19:04:36Z)
A One-shot Framework for Distributed Clustered Learning in Heterogeneous Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文参考訳（メタデータ） (2022-09-22T09:04:10Z)
Learning Statistical Representation with Joint Deep Embedded Clustering [2.1267423178232407]
StatDECは、共同統計表現学習とクラスタリングのための教師なしのフレームワークである。実験により,これらの表現を用いることで,様々な画像データセットにまたがる不均衡な画像クラスタリングの結果を大幅に改善できることが示された。
論文参考訳（メタデータ） (2021-09-11T09:26:52Z)
Unsupervised Clustered Federated Learning in Complex Multi-source Acoustic Environments [75.8001929811943]
現実的で挑戦的なマルチソース・マルチルーム音響環境を導入する。本稿では,音響シーンの変動を考慮したクラスタリング制御手法を提案する。提案手法はクラスタリングに基づく測度を用いて最適化され,ネットワークワイド分類タスクによって検証される。
論文参考訳（メタデータ） (2021-06-07T14:51:39Z)
Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文参考訳（メタデータ） (2020-10-22T15:58:35Z)
Combined Cleaning and Resampling Algorithm for Multi-Class Imbalanced Data with Label Noise [11.868507571027626]
本稿では,新しいオーバーサンプリング手法であるマルチクラス・コンバインド・クリーニングとリサンプリングのアルゴリズムを提案する。提案手法は, オーバーサンプリングに適した領域をモデル化するためのエネルギーベース手法を用いて, SMOTEよりも小さな解離や外れ値の影響を受けない。重なり合うクラス分布が学習アルゴリズムの性能に与える影響を低減することを目的として, 同時クリーニング操作と組み合わせた。
論文参考訳（メタデータ） (2020-04-07T13:59:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。