論文の概要: Overlapping oriented imbalanced ensemble learning method based on
projective clustering and stagewise hybrid sampling
- arxiv url: http://arxiv.org/abs/2212.03182v1
- Date: Wed, 30 Nov 2022 01:49:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 12:52:57.814580
- Title: Overlapping oriented imbalanced ensemble learning method based on
projective clustering and stagewise hybrid sampling
- Title(参考訳): 投影的クラスタリングと段階的ハイブリッドサンプリングに基づく重複指向不均衡アンサンブル学習法
- Authors: Fan Li, Bo Wang, Pin Wang, Yongming Li
- Abstract要約: 本稿では、二重クラスタリングとステージワイドハイブリッドサンプリング(DCSHS)に基づくアンサンブル学習アルゴリズムを提案する。
我々のアルゴリズムの大きな利点は、重なり合う多数サンプルのソフトな除去を実現するためにCSの交叉性を利用することができることである。
- 参考スコア(独自算出の注目度): 22.32930261633615
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The challenge of imbalanced learning lies not only in class imbalance
problem, but also in the class overlapping problem which is complex. However,
most of the existing algorithms mainly focus on the former. The limitation
prevents the existing methods from breaking through. To address this
limitation, this paper proposes an ensemble learning algorithm based on dual
clustering and stage-wise hybrid sampling (DCSHS). The DCSHS has three parts.
Firstly, we design a projection clustering combination framework (PCC) guided
by Davies-Bouldin clustering effectiveness index (DBI), which is used to obtain
high-quality clusters and combine them to obtain a set of cross-complete
subsets (CCS) with balanced class and low overlapping. Secondly, according to
the characteristics of subset classes, a stage-wise hybrid sampling algorithm
is designed to realize the de-overlapping and balancing of subsets. Finally, a
projective clustering transfer mapping mechanism (CTM) is constructed for all
processed subsets by means of transfer learning, thereby reducing class
overlapping and explore structure information of samples. The major advantage
of our algorithm is that it can exploit the intersectionality of the CCS to
realize the soft elimination of overlapping majority samples, and learn as much
information of overlapping samples as possible, thereby enhancing the class
overlapping while class balancing. In the experimental section, more than 30
public datasets and over ten representative algorithms are chosen for
verification. The experimental results show that the DCSHS is significantly
best in terms of various evaluation criteria.
- Abstract(参考訳): 不均衡学習の課題は、クラス不均衡問題だけでなく、複雑なクラス重複問題にも関係している。
しかし、既存のアルゴリズムのほとんどは、主に前者に焦点を当てている。
この制限は既存のメソッドが破られるのを防ぐ。
本稿では,この制限に対処するために,二重クラスタリングとステージワイドハイブリッドサンプリング(DCSHS)に基づくアンサンブル学習アルゴリズムを提案する。
DCSHSには3つの部分がある。
まず,Davies-Bouldinクラスタリング効率指数(DBI)によって導かれるプロジェクションクラスタリング結合フレームワーク(PCC)を設計し,高品質なクラスタを取得し,それらを組み合わせて,バランスの取れたクラスと低いオーバーラップを持つクロスコンプリートサブセット(CCS)の集合を得る。
第二に、部分集合クラスの特性に基づき、部分集合の重複解消とバランス化を実現するために、ステージワイズハイブリッドサンプリングアルゴリズムが設計されている。
最後に、転送学習によってすべての処理されたサブセットに対して、投影型クラスタリング転送マッピング機構(ctm)を構築し、クラスの重複を減らし、サンプルの構造情報を探索する。
提案アルゴリズムの主な利点は,CCSの交差性を利用して重複する多数サンプルのソフトな除去を実現し,重複するサンプルの情報をできるだけ多く学習し,クラスバランス中に重複するクラスを増大させることである。
実験セクションでは、30以上の公開データセットと10以上の代表アルゴリズムが検証のために選択される。
実験結果から,DCSHSは各種評価基準において有意に優れていた。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Deep Embedding Clustering Driven by Sample Stability [16.53706617383543]
サンプル安定性(DECS)により駆動されるディープ埋め込みクラスタリングアルゴリズムを提案する。
具体的には、まずオートエンコーダで初期特徴空間を構築し、次にサンプル安定性に制約されたクラスタ指向の埋め込み機能を学ぶ。
5つのデータセットに対する実験結果から,提案手法は最先端のクラスタリング手法と比較して優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-01-29T09:19:49Z) - Stable Cluster Discrimination for Deep Clustering [7.175082696240088]
ディープクラスタリングは、インスタンスの表現(つまり、表現学習)を最適化し、固有のデータ分散を探索することができる。
結合された目的は、すべてのインスタンスが一様機能に崩壊する、自明な解決策を意味する。
本研究では,1段階クラスタリングにおいて,教師あり学習における一般的な識別タスクが不安定であることを示す。
新規な安定クラスタ識別(SeCu)タスクを提案し、それに応じて新しいハードネス対応クラスタリング基準を得ることができる。
論文 参考訳(メタデータ) (2023-11-24T06:43:26Z) - Envelope Imbalance Learning Algorithm based on Multilayer Fuzzy C-means
Clustering and Minimum Interlayer discrepancy [14.339674126923903]
本稿では,マルチ層ファジィc-means(MlFCM)と最小層間離散化機構(MIDMD)を用いたディープインスタンスエンベロープネットワークに基づく不均衡学習アルゴリズムを提案する。
このアルゴリズムは、事前の知識がなければ、ディープインスタンスエンベロープネットワークを使用して、高品質なバランスの取れたインスタンスを保証できる。
論文 参考訳(メタデータ) (2021-11-02T04:59:57Z) - Transductive Few-Shot Learning: Clustering is All You Need? [31.21306826132773]
そこで本研究では,プロトタイプをベースとした超越的数ショット学習の汎用的定式化について検討する。
提案手法は, 精度と最適化の観点から, 大きな問題にスケールアップしながら, 競争性能を向上する。
驚いたことに、私たちの一般的なモデルは、最先端の学習と比較して、すでに競争力のあるパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2021-06-16T16:14:01Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Progressive Cluster Purification for Unsupervised Feature Learning [48.87365358296371]
教師なしの特徴学習では、サンプル特異性に基づく手法はクラス間の情報を無視する。
本稿では,プログレッシブクラスタ形成時にクラス不整合サンプルを除外するクラスタリングに基づく新しい手法を提案する。
我々の手法は、プログレッシブ・クラスタ・パーフィケーション(PCP)と呼ばれ、訓練中に徐々にクラスタ数を減らし、プログレッシブ・クラスタリングを実装している。
論文 参考訳(メタデータ) (2020-07-06T08:11:03Z) - Generalized Zero-Shot Learning Via Over-Complete Distribution [79.5140590952889]
そこで本稿では,CVAE (Conditional Variational Autoencoder) を用いたOCD(Over-Complete Distribution) の生成を提案する。
フレームワークの有効性は,Zero-Shot LearningプロトコルとGeneralized Zero-Shot Learningプロトコルの両方を用いて評価する。
論文 参考訳(メタデータ) (2020-04-01T19:05:28Z) - A Classification-Based Approach to Semi-Supervised Clustering with
Pairwise Constraints [5.639904484784126]
対制約付き半教師付きクラスタリングのためのネットワークフレームワークを提案する。
既存のアプローチとは対照的に、SSCを2つの単純な分類タスク/ステージに分解する。
提案手法であるS3C2は、二項分類がマルチクラスクラスタリングよりも容易であるという観察から動機づけられている。
論文 参考訳(メタデータ) (2020-01-18T20:13:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。