論文の概要: Assessing One-Dimensional Cluster Stability by Extreme-Point Trimming
- arxiv url: http://arxiv.org/abs/2509.00258v1
- Date: Fri, 29 Aug 2025 21:52:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.14861
- Title: Assessing One-Dimensional Cluster Stability by Extreme-Point Trimming
- Title(参考訳): 極点トリミングによる一次元クラスタ安定性の評価
- Authors: Erwan Dereure, Emmanuel Akame Mfoumou, David Holcman,
- Abstract要約: 本研究では, 一次元試料のテール挙動と幾何学的安定性を評価するための確率的手法を開発した。
有限サンプル補正を含む解析式は、一様仮説とガウス仮説の両方の下で期待される縮退について導出する。
我々はさらにクラスタリングパイプライン(DBSCANなど)に統合し、密度推定やパラメータチューニングなしに1次元のクラスタを検証する能力を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We develop a probabilistic method for assessing the tail behavior and geometric stability of one-dimensional n i.i.d. samples by tracking how their span contracts when the most extreme points are trimmed. Central to our approach is the diameter-shrinkage ratio, that quantifies the relative reduction in data range as extreme points are successively removed. We derive analytical expressions, including finite-sample corrections, for the expected shrinkage under both the uniform and Gaussian hypotheses, and establish that these curves remain distinct even for moderate number of removal. We construct an elementary decision rule that assigns a sample to whichever theoretical shrinkage profile it most closely follows. This test achieves higher classification accuracy than the classical likelihood-ratio test in small-sample or noisy regimes, while preserving asymptotic consistency for large n. We further integrate our criterion into a clustering pipeline (e.g. DBSCAN), demonstrating its ability to validate one-dimensional clusters without any density estimation or parameter tuning. This work thus provides both theoretical insight and practical tools for robust distributional inference and cluster stability analysis.
- Abstract(参考訳): 極端点がトリミングされたとき、どのように縮尺されたかを追跡することにより、一次元のn-d.サンプルのテール挙動と幾何安定性を評価する確率的手法を開発した。
我々のアプローチの中心は、極端点が連続的に除去されるにつれて、データ範囲の相対的な減少を定量化する直径収縮比である。
有限サンプル補正を含む解析式は、一様およびガウス的仮定の両方の下で期待される縮退に対して導出し、これらの曲線が適度な数の除去においても相変わらず存在することを証明した。
我々は,どの理論的縮小プロファイルであっても,最も密接に従うサンプルを割り当てる基本的決定ルールを構築した。
このテストは、大きな n に対して漸近的整合性を保持しながら、小さなサンプルまたはノイズ状態における古典的確率比テストよりも高い分類精度を達成する。
我々はさらにクラスタリングパイプライン(例えばDBSCAN)に基準を組み込み、密度推定やパラメータチューニングなしに一次元クラスタを検証する能力を示す。
この研究は、ロバストな分布推定とクラスタ安定性解析のための理論的な洞察と実践的なツールの両方を提供する。
関連論文リスト
- Unregularized limit of stochastic gradient method for Wasserstein distributionally robust optimization [8.784017987697688]
分散ロバストな最適化は、機械学習におけるモデル適合のための魅力的なフレームワークを提供する。
本研究では, エントロピーな平滑化が元の目的のサンプリングに基づく近似を導出する正規化問題について検討する。
論文 参考訳(メタデータ) (2025-06-05T12:21:44Z) - A Unified Theory of Stochastic Proximal Point Methods without Smoothness [52.30944052987393]
近点法はその数値的安定性と不完全なチューニングに対する頑健性からかなりの関心を集めている。
本稿では,近位点法(SPPM)の幅広いバリエーションの包括的解析について述べる。
論文 参考訳(メタデータ) (2024-05-24T21:09:19Z) - Robust Stochastic Optimization via Gradient Quantile Clipping [6.2844649973308835]
グラディエントDescent(SGD)のための量子クリッピング戦略を導入する。
通常のクリッピングチェーンとして、グラデーション・ニュー・アウトリージを使用します。
本稿では,Huberiles を用いたアルゴリズムの実装を提案する。
論文 参考訳(メタデータ) (2023-09-29T15:24:48Z) - Curvature-Independent Last-Iterate Convergence for Games on Riemannian
Manifolds [77.4346324549323]
本研究では, 多様体の曲率に依存しないステップサイズが, 曲率非依存かつ直線的最終点収束率を達成することを示す。
我々の知る限りでは、曲率非依存率や/または最終点収束の可能性はこれまでに検討されていない。
論文 参考訳(メタデータ) (2023-06-29T01:20:44Z) - Convergence of uncertainty estimates in Ensemble and Bayesian sparse
model discovery [4.446017969073817]
ブートストラップに基づく逐次しきい値最小二乗推定器による雑音に対する精度と頑健性の観点から経験的成功を示す。
このブートストラップに基づくアンサンブル手法は,誤差率の指数収束率で,確率的に正しい可変選択を行うことができることを示す。
論文 参考訳(メタデータ) (2023-01-30T04:07:59Z) - Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文 参考訳(メタデータ) (2022-09-26T16:41:16Z) - On the Convergence of Stochastic Extragradient for Bilinear Games with
Restarted Iteration Averaging [96.13485146617322]
本稿では, ステップサイズが一定であるSEG法の解析を行い, 良好な収束をもたらす手法のバリエーションを示す。
平均化で拡張した場合、SEGはナッシュ平衡に確実に収束し、スケジュールされた再起動手順を組み込むことで、その速度が確実に加速されることを証明した。
論文 参考訳(メタデータ) (2021-06-30T17:51:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。