論文の概要: On the Objective and Feature Weights of Minkowski Weighted k-Means
- arxiv url: http://arxiv.org/abs/2603.25958v1
- Date: Thu, 26 Mar 2026 22:57:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.308488
- Title: On the Objective and Feature Weights of Minkowski Weighted k-Means
- Title(参考訳): ミンコフスキー重み付きk平均の目的量と特徴量について
- Authors: Renato Cordeiro de Amorim, Vladimir Makarenkov,
- Abstract要約: ミンコフスキー重み付きk平均(mwk-means)アルゴリズムは、特徴量とミンコフスキー距離を組み込むことで古典的なk平均を拡張する。
我々は、mwk-means目的をミンコフスキー指数 p で決定された順序で、クラスタ内分散のパワー平均集合として表すことができることを示す。
- 参考スコア(独自算出の注目度): 0.7734726150561086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Minkowski weighted k-means (mwk-means) algorithm extends classical k-means by incorporating feature weights and a Minkowski distance. Despite its empirical success, its theoretical properties remain insufficiently understood. We show that the mwk-means objective can be expressed as a power-mean aggregation of within-cluster dispersions, with the order determined by the Minkowski exponent p. This formulation reveals how p controls the transition between selective and uniform use of features. Using this representation, we derive bounds for the objective function and characterise the structure of the feature weights, showing that they depend only on relative dispersion and follow a power-law relationship with dispersion ratios. This leads to explicit guarantees on the suppression of high-dispersion features. Finally, we establish convergence of the algorithm and provide a unified theoretical interpretation of its behaviour.
- Abstract(参考訳): ミンコフスキー重み付きk平均(mwk-means)アルゴリズムは、特徴量とミンコフスキー距離を組み込むことで古典的なk平均を拡張する。
実証的な成功にもかかわらず、その理論的性質は十分に理解されていない。
我々は、mwk-means目的をミンコフスキー指数 p で決定された順序で、クラスタ内分散のパワー平均集合として表すことができることを示す。
この定式化は、p が特徴の選択的利用と一様利用の間の遷移を制御する方法を明らかにする。
この表現を用いて、目的関数の境界を導出し、特徴量の構造を特徴づけ、それらが相対分散にのみ依存し、分散比と電力-法則関係に従うことを示す。
これにより、高分散特性の抑制が明確に保証される。
最後に、アルゴリズムの収束を確立し、その振る舞いの統一的な理論的解釈を提供する。
関連論文リスト
- Spectral Algorithms in Misspecified Regression: Convergence under Covariate Shift [0.2578242050187029]
スペクトルアルゴリズムは逆問題から派生した正則化手法のクラスである。
本稿では,共変量シフトの下でのスペクトルアルゴリズムの収束特性について検討する。
我々は、ターゲット関数がヒルベルト空間(RKHS)を再現するカーネルに属さない、より困難な不特定ケースの理論解析を提供する。
論文 参考訳(メタデータ) (2025-09-05T13:42:27Z) - Learning Overspecified Gaussian Mixtures Exponentially Fast with the EM Algorithm [5.625796693054093]
過特定ガウス混合モデルに適用した場合のEMアルゴリズムの収束特性について検討する。
集団EMアルゴリズムはクルバック・リーブラー距離(KL)において指数関数的に高速に収束することを示した。
論文 参考訳(メタデータ) (2025-06-13T14:57:57Z) - Optimal Particle-based Approximation of Discrete Distributions (OPAD) [7.127829790714167]
粒子の集合に対して、ターゲット分布から(粒子をベースとした)近似のクルバック・リブラー(KL)の発散を最小限に抑える一意の重み付け機構が存在することを示す。
既存の粒子法で既に計算されている値に基づいて最適な重みを求めることができることを示す。
論文 参考訳(メタデータ) (2024-11-30T17:36:59Z) - A Uniform Concentration Inequality for Kernel-Based Two-Sample Statistics [4.757470449749877]
これらの指標はカーネルベースの2サンプル統計学の一般的な枠組みの下で統一可能であることを示す。
本稿では、上記のカーネルベースの統計量に対して、新しい一様濃度不等式を確立する。
図示的応用として,これらの境界が距離共分散に基づく次元減少などの手順における誤差境界の構成をどのように促進するかを示す。
論文 参考訳(メタデータ) (2024-05-22T22:41:56Z) - Empirical Density Estimation based on Spline Quasi-Interpolation with
applications to Copulas clustering modeling [0.0]
密度推定は、様々な分野において、基礎となるデータの分布をモデル化し理解するための基礎的な手法である。
本稿では,擬似補間による密度の単変量近似を提案する。
提案アルゴリズムは人工データセットと実データセットで検証される。
論文 参考訳(メタデータ) (2024-02-18T11:49:38Z) - Adaptive Annealed Importance Sampling with Constant Rate Progress [68.8204255655161]
Annealed Importance Smpling (AIS)は、抽出可能な分布から重み付けされたサンプルを合成する。
本稿では,alpha$-divergencesに対する定数レートAISアルゴリズムとその効率的な実装を提案する。
論文 参考訳(メタデータ) (2023-06-27T08:15:28Z) - Enriching Disentanglement: From Logical Definitions to Quantitative Metrics [59.12308034729482]
複雑なデータにおける説明的要素を遠ざけることは、データ効率の表現学習にとって有望なアプローチである。
論理的定義と量的指標の関連性を確立し, 理論的に根ざした絡み合いの指標を導出する。
本研究では,非交叉表現の異なる側面を分離することにより,提案手法の有効性を実証的に実証する。
論文 参考訳(メタデータ) (2023-05-19T08:22:23Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Robust Estimation for Nonparametric Families via Generative Adversarial
Networks [92.64483100338724]
我々は,高次元ロバストな統計問題を解くためにGAN(Generative Adversarial Networks)を設計するためのフレームワークを提供する。
我々の研究は、これらをロバスト平均推定、第二モーメント推定、ロバスト線形回帰に拡張する。
技術面では、提案したGAN損失は、スムーズで一般化されたコルモゴロフ-スミルノフ距離と見なすことができる。
論文 参考訳(メタデータ) (2022-02-02T20:11:33Z) - A Note on Optimizing Distributions using Kernel Mean Embeddings [94.96262888797257]
カーネル平均埋め込みは、その無限次元平均埋め込みによる確率測度を表す。
カーネルが特徴的である場合、カーネルの総和密度を持つ分布は密度が高いことを示す。
有限サンプル設定でそのような分布を最適化するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2021-06-18T08:33:45Z) - Profile Entropy: A Fundamental Measure for the Learnability and
Compressibility of Discrete Distributions [63.60499266361255]
離散分布のサンプルに対して、プロファイルエントロピーは推定、推論、圧縮の概念を統一する基本的な尺度であることを示す。
具体的には、プロファイルエントロピー a) は、最適自然推定器に対する分布を推定する速度を決定する; b) 任意のラベル不変分布コレクションに対する最適推定器と比較して全ての対称特性を推定する速度を特徴付ける; c) プロファイル圧縮の限界として機能する。
論文 参考訳(メタデータ) (2020-02-26T17:49:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。