論文の概要: Breaking the Reclustering Barrier in Centroid-based Deep Clustering
- arxiv url: http://arxiv.org/abs/2411.02275v1
- Date: Mon, 04 Nov 2024 17:05:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:42:11.838118
- Title: Breaking the Reclustering Barrier in Centroid-based Deep Clustering
- Title(参考訳): セントロイドを用いたディープクラスタリングにおける再クラスタリングバリアの破壊
- Authors: Lukas Miklautz, Timo Klein, Kevin Sidak, Collin Leiber, Thomas Lang, Andrii Shkabrii, Sebastian Tschiatschek, Claudia Plant,
- Abstract要約: 本研究は,Centroid-based Deep Clustering (DC)アルゴリズムにおける重要な現象について考察する。
我々はこの現象を「再クラスタ化障壁」と呼び、再クラスタ化障壁が発生した時に経験的に示す。
このアルゴリズムを広く使われているDCアルゴリズムに適用すると、(1)BRBはクラスタリングベンチマークの幅広い範囲で一貫して性能を向上し、(2)BRBはスクラッチからのトレーニングを可能にし、(3)BRBは対照的な損失と組み合わせることで、最先端のDCアルゴリズムに対して競争力を発揮する。
- 参考スコア(独自算出の注目度): 14.46038373952649
- License:
- Abstract: This work investigates an important phenomenon in centroid-based deep clustering (DC) algorithms: Performance quickly saturates after a period of rapid early gains. Practitioners commonly address early saturation with periodic reclustering, which we demonstrate to be insufficient to address performance plateaus. We call this phenomenon the "reclustering barrier" and empirically show when the reclustering barrier occurs, what its underlying mechanisms are, and how it is possible to Break the Reclustering Barrier with our algorithm BRB. BRB avoids early over-commitment to initial clusterings and enables continuous adaptation to reinitialized clustering targets while remaining conceptually simple. Applying our algorithm to widely-used centroid-based DC algorithms, we show that (1) BRB consistently improves performance across a wide range of clustering benchmarks, (2) BRB enables training from scratch, and (3) BRB performs competitively against state-of-the-art DC algorithms when combined with a contrastive loss. We release our code and pre-trained models at https://github.com/Probabilistic-and-Interactive-ML/breaking-the-reclustering-barrier .
- Abstract(参考訳): 本研究は,Centroid-based Deep Clustering (DC)アルゴリズムにおける重要な現象について考察する。
実践者は、周期的再クラスタリングによる早期飽和に対処することが一般的であり、パフォーマンスプラトーに対処するには不十分であることを示す。
我々はこの現象を「再クラスタ化障壁」と呼び、再クラスタ化障壁の発生時、その基盤となるメカニズム、そして我々のアルゴリズム BRB で再クラスタ化バリアを破る方法について実証的に示す。
BRBは初期クラスタリングへの初期の過剰コミットを回避し、概念的には単純でありながら再起動されたクラスタリングターゲットへの継続的適応を可能にする。
提案アルゴリズムをCentroid-based DCアルゴリズムに適用することにより,(1)BRBはクラスタリングベンチマークの幅広い範囲で一貫して性能を向上し,(2)BRBはスクラッチからトレーニングが可能であり,(3)BRBは対照的な損失と組み合わせることで,最先端のDCアルゴリズムに対して競争力を発揮することを示す。
コードと事前トレーニングされたモデルをhttps://github.com/Probabilistic-and-Interactive-ML/breaking-the-reclustering-barrierでリリースしています。
関連論文リスト
- Proportional Fairness in Non-Centroid Clustering [34.91134564352282]
我々は、グループフェアネスを保証することを目的として、最近開発された、比例フェアクラスタリングのフレームワークを再考する。
フレームワークを非セントロイドクラスタリングに拡張し、エージェントの損失はそのクラスタ内の他のエージェントの関数である。
我々は、GreedyCaptureアルゴリズムの適応を用いて、我々が確立できる最良の近似が自然損失関数には適用されないことを示す。
論文 参考訳(メタデータ) (2024-10-30T17:53:49Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Unfolding ADMM for Enhanced Subspace Clustering of Hyperspectral Images [43.152314090830174]
本稿では,スパースサブスペースクラスタリングのためのマルチプライヤの交互方向法(ADMM)に基づく反復解法を展開させることにより,ハイパースペクトル画像(HSI)のための革新的なクラスタリングアーキテクチャを提案する。
提案手法は, 構造保存モジュールの一部として, K近傍近傍のアルゴリズムを用いて, HSIデータの構造特性をよく把握する。
論文 参考訳(メタデータ) (2024-04-10T15:51:46Z) - Robust and Automatic Data Clustering: Dirichlet Process meets
Median-of-Means [18.3248037914529]
本稿では,モデルに基づく手法とセントロイド方式の原理を統合することにより,効率的かつ自動的なクラスタリング手法を提案する。
クラスタリング誤差の上限に関する統計的保証は,既存のクラスタリングアルゴリズムよりも提案手法の利点を示唆している。
論文 参考訳(メタデータ) (2023-11-26T19:01:15Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z) - Fairness Degrading Adversarial Attacks Against Clustering Algorithms [35.40427659749882]
そこで本研究では,k-medianクラスタリングのためのフェアネス劣化攻撃アルゴリズムを提案する。
生成した対数サンプルの追加により、フェアネス値が大幅に低下することが判明した。
論文 参考訳(メタデータ) (2021-10-22T19:10:27Z) - Hybrid Dynamic Contrast and Probability Distillation for Unsupervised
Person Re-Id [109.1730454118532]
非監督的人物再識別(Re-Id)は、リードワールドビデオ監視システムにおける実践的応用により注目されている。
本稿では,ハイブリッド動的クラスタコントラストと確率蒸留アルゴリズムを提案する。
教師なしRe-Id問題を局所-言語的ダイナミックコントラスト学習と自己教師付き確率蒸留の枠組みに統合する。
論文 参考訳(メタデータ) (2021-09-29T02:56:45Z) - Correlation Clustering Reconstruction in Semi-Adversarial Models [70.11015369368272]
相関クラスタリングは多くのアプリケーションにおいて重要なクラスタリング問題である。
本研究では,ランダムノイズや対向的な修正によって崩壊した潜伏クラスタリングを再構築しようとする,この問題の再構築版について検討する。
論文 参考訳(メタデータ) (2021-08-10T14:46:17Z) - Adversarial Robustness of Streaming Algorithms through Importance
Sampling [29.957317489789745]
我々は、中央の機械学習とアルゴリズムタスクに逆向きに頑健なストリーミングアルゴリズムを導入する。
我々の結果は、多くの重要なサンプリングベースのアルゴリズムが敵の堅牢性をもたらすという、単純だが強力で観察に基づいている。
我々は、様々な敵攻撃に対するアルゴリズムの堅牢性を実証的に確認し、対照的に、いくつかの一般的なアルゴリズムは堅牢ではないことを示す。
論文 参考訳(メタデータ) (2021-06-28T19:24:11Z) - (k, l)-Medians Clustering of Trajectories Using Continuous Dynamic Time
Warping [57.316437798033974]
本研究では,トラジェクトリの集中型クラスタリングの問題について考察する。
我々はDTWの連続バージョンを距離測定として使用することを提案し、これをCDTW(Continuous dynamic time warping)と呼ぶ。
一連の軌道から中心を計算し、その後反復的に改善する実践的な方法を示す。
論文 参考訳(メタデータ) (2020-12-01T13:17:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。