論文の概要: Doubly Stochastic Mean-Shift Clustering
- arxiv url: http://arxiv.org/abs/2602.15393v1
- Date: Tue, 17 Feb 2026 07:02:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:18.004192
- Title: Doubly Stochastic Mean-Shift Clustering
- Title(参考訳): 二重確率平均シフトクラスタリング
- Authors: Tom Trigano, Yann Sepulcre, Itshak Lapidot,
- Abstract要約: 提案するDouubly Mean-Shift(DSMS)は,トラジェクトリだけでなく,カーネル帯域幅自体にもランダム性を導入する新しい拡張である。
このランダム化された帯域幅ポリシーは暗黙の正規化機構として機能し、収束理論結果を提供する。
- 参考スコア(独自算出の注目度): 1.4299355089723902
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Standard Mean-Shift algorithms are notoriously sensitive to the bandwidth hyperparameter, particularly in data-scarce regimes where fixed-scale density estimation leads to fragmentation and spurious modes. In this paper, we propose Doubly Stochastic Mean-Shift (DSMS), a novel extension that introduces randomness not only in the trajectory updates but also in the kernel bandwidth itself. By drawing both the data samples and the radius from a continuous uniform distribution at each iteration, DSMS effectively performs a better exploration of the density landscape. We show that this randomized bandwidth policy acts as an implicit regularization mechanism, and provide convergence theoretical results. Comparative experiments on synthetic Gaussian mixtures reveal that DSMS significantly outperforms standard and stochastic Mean-Shift baselines, exhibiting remarkable stability and preventing over-segmentation in sparse clustering scenarios without other performance degradation.
- Abstract(参考訳): 標準平均シフトアルゴリズムは帯域幅ハイパーパラメータに敏感なことで知られており、特に固定スケール密度推定がフラグメンテーションやスプリアスモードに繋がるデータスカース方式では有名である。
本稿では,Douubly Stochastic Mean-Shift(DSMS)を提案する。これはトラジェクトリ更新だけでなく,カーネル帯域幅自体にもランダム性を導入する新しい拡張である。
各イテレーションでデータサンプルと半径の両方を連続的な均一分布から描画することにより、DSMSは、密度景観のより優れた探索を効果的に行うことができる。
このランダム化された帯域幅ポリシーは暗黙の正規化機構として機能し、収束理論結果を提供する。
合成ガウス混合物の比較実験により、DSMSは標準および確率的平均シフトベースラインを著しく上回り、顕著な安定性を示し、他の性能劣化を伴わないスパースクラスタリングシナリオにおいて過剰なセグメンテーションを防止していることが明らかとなった。
関連論文リスト
- Silent Inconsistency in Data-Parallel Full Fine-Tuning: Diagnosing Worker-Level Optimization Misalignment [27.352639822596146]
クロスワーカーの損失と勾配のばらつきは、従来の監視信号では見えない。
本稿では,標準パイプラインで容易に利用できるトレーニング信号を用いて,作業者レベルの一貫性を定量化する,モデルに依存しない診断フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-16T04:42:30Z) - GTS: Inference-Time Scaling of Latent Reasoning with a Learnable Gaussian Thought Sampler [54.10960908347221]
我々は、学習可能な密度から条件付きサンプリングとして潜在思考探索をモデル化し、このアイデアをガウス思想サンプリング(GTS)としてインスタンス化する。
GTSは、連続的推論状態における文脈依存摂動分布を予測し、バックボーンを凍結させながらGRPOスタイルのポリシー最適化を訓練する。
論文 参考訳(メタデータ) (2026-02-15T09:57:47Z) - Fast Sampling for Flows and Diffusions with Lazy and Point Mass Stochastic Interpolants [5.492889521988414]
任意のスケジュール下で任意の拡散係数で微分方程式(SDE)のサンプルパスを変換する方法を証明する。
次に、補間フレームワークを拡張して、より大きな点質量スケジュールのクラスを許容する。
論文 参考訳(メタデータ) (2026-02-03T17:48:34Z) - Cross-Modal Retrieval with Cauchy-Schwarz Divergence [26.94915416778522]
クロスモーダル検索では、不均一なデータ型を堅牢にアライメントする必要がある。
既存の手法の多くは、Kullback-Leiblerの発散のような分布アライメント技術に依存している。
本稿では、トレーニング安定性と検索性能の両方を改善するハイパーパラメータフリー尺度であるCauchy-Schwarz(CS)の発散について紹介する。
論文 参考訳(メタデータ) (2025-09-15T08:55:15Z) - Robust Representation Consistency Model via Contrastive Denoising [83.47584074390842]
ランダムな平滑化は、敵の摂動に対する堅牢性を証明する理論的保証を提供する。
拡散モデルは、ノイズ摂動サンプルを浄化するためにランダムな平滑化に成功している。
我々は,画素空間における拡散軌跡に沿った生成的モデリングタスクを,潜在空間における識別的タスクとして再構成する。
論文 参考訳(メタデータ) (2025-01-22T18:52:06Z) - Denoising diffusion probabilistic models are optimally adaptive to unknown low dimensionality [21.10158431913811]
DDPMは,本質的な低次元データの自動利用により,サンプリングスピードアップを実現することができるかを検討する。
DDPMの繰り返し複雑性は$k$とほぼ線形にスケールすることが証明され、KL分散を用いて分布の相違を測定するのに最適である。
論文 参考訳(メタデータ) (2024-10-24T14:36:12Z) - Risk-Sensitive Diffusion: Robustly Optimizing Diffusion Models with Noisy Samples [58.68233326265417]
非画像データは実際のアプリケーションで広く使われており、ノイズが多い傾向にある。
リスク感受性SDEは、リスクベクトルによってパラメータ化された微分方程式(SDE)の一種である。
我々はガウス雑音分布と非ガウス雑音分布の両方について系統的研究を行う。
論文 参考訳(メタデータ) (2024-02-03T08:41:51Z) - Adaptive Annealed Importance Sampling with Constant Rate Progress [68.8204255655161]
Annealed Importance Smpling (AIS)は、抽出可能な分布から重み付けされたサンプルを合成する。
本稿では,alpha$-divergencesに対する定数レートAISアルゴリズムとその効率的な実装を提案する。
論文 参考訳(メタデータ) (2023-06-27T08:15:28Z) - Decentralized Local Stochastic Extra-Gradient for Variational
Inequalities [125.62877849447729]
我々は、不均一(非IID)で多くのデバイスに分散する問題データを持つ領域上での分散変分不等式(VIs)を考察する。
我々は、完全に分散化された計算の設定を網羅する計算ネットワークについて、非常に一般的な仮定を行う。
理論的には, モノトン, モノトンおよび非モノトンセッティングにおける収束速度を理論的に解析する。
論文 参考訳(メタデータ) (2021-06-15T17:45:51Z) - Minority Oversampling for Imbalanced Time Series Classification [7.695093197007146]
本稿では,高次元不均衡時間系列分類に対処するオーバーサンプリング手法を提案する。
いくつかの公開時系列データセットの実験結果は、最先端のオーバーサンプリングアルゴリズムに対するOHITの優位性を示している。
論文 参考訳(メタデータ) (2020-04-14T09:20:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。