論文の概要: When fractional quasi p-norms concentrate
- arxiv url: http://arxiv.org/abs/2505.19635v1
- Date: Mon, 26 May 2025 07:53:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.259
- Title: When fractional quasi p-norms concentrate
- Title(参考訳): 分数的準 p-ノルムが集中する場合
- Authors: Ivan Y. Tyukin, Bogdan Grechuk, Evgeny M. Mirkes, Alexander N. Gorban,
- Abstract要約: 高次元における距離の集中は、安定かつ信頼性の高いデータ解析アルゴリズムの開発と設計にとって重要な要素である。
分数準位$p$-ノルムが集中する条件と、そうでない条件を同定する。
- 参考スコア(独自算出の注目度): 44.83880683386964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Concentration of distances in high dimension is an important factor for the development and design of stable and reliable data analysis algorithms. In this paper, we address the fundamental long-standing question about the concentration of distances in high dimension for fractional quasi $p$-norms, $p\in(0,1)$. The topic has been at the centre of various theoretical and empirical controversies. Here we, for the first time, identify conditions when fractional quasi $p$-norms concentrate and when they don't. We show that contrary to some earlier suggestions, for broad classes of distributions, fractional quasi $p$-norms admit exponential and uniform in $p$ concentration bounds. For these distributions, the results effectively rule out previously proposed approaches to alleviate concentration by "optimal" setting the values of $p$ in $(0,1)$. At the same time, we specify conditions and the corresponding families of distributions for which one can still control concentration rates by appropriate choices of $p$. We also show that in an arbitrarily small vicinity of a distribution from a large class of distributions for which uniform concentration occurs, there are uncountably many other distributions featuring anti-concentration properties. Importantly, this behavior enables devising relevant data encoding or representation schemes favouring or discouraging distance concentration. The results shed new light on this long-standing problem and resolve the tension around the topic in both theory and empirical evidence reported in the literature.
- Abstract(参考訳): 高次元における距離の集中は、安定かつ信頼性の高いデータ解析アルゴリズムの開発と設計にとって重要な要素である。
本稿では、分数準位$p$-norms, $p\in(0,1)$に対して、高次元における距離の集中に関する基本的な長年の疑問に対処する。
この話題は様々な理論的・実証的な論争の中心にある。
ここではじめて、分数準位数$p$-ノルムが集中する条件と、そうでない条件を識別する。
より広い分布のクラスに対して、いくつかの以前の提案とは対照的に、分数的な$p$-ノルムは指数的かつ$p$濃度境界において一様であることを示す。
これらの分布について、この結果は、p$ in $(0, 1)$ の値を「最適」に設定することで、従来提案されていた濃度を緩和するアプローチを効果的に除外する。
同時に、条件と対応する分布の族を指定し、$p$の適切な選択で濃度率を制御できる。
また,一様濃度の分布から得られる分布が任意に小さい場合,反集束特性を特徴とする分布が無数に存在することを示す。
重要なことに、この行動は、距離集中を好まない、または阻止する、関連するデータエンコーディングや表現スキームの考案を可能にする。
その結果、この長期間にわたる問題に新たな光を当て、論文で報告された理論と実証的な証拠の両方において、このトピックに関する緊張を解消した。
関連論文リスト
- Theory on Score-Mismatched Diffusion Models and Zero-Shot Conditional Samplers [49.97755400231656]
一般のスコアミスマッチ拡散サンプリング器に対する明示的な次元依存性を持つ最初の性能保証を示す。
その結果, スコアミスマッチは, 目標分布とサンプリング分布の分布バイアスとなり, 目標分布とトレーニング分布の累積ミスマッチに比例することがわかった。
この結果は、測定ノイズに関係なく、任意の条件モデルに対するゼロショット条件付きサンプリングに直接適用することができる。
論文 参考訳(メタデータ) (2024-10-17T16:42:12Z) - Flow matching achieves almost minimax optimal convergence [50.38891696297888]
フローマッチング (FM) は, シミュレーションのない生成モデルとして注目されている。
本稿では,大試料径のFMの収束特性を$p$-Wasserstein 距離で論じる。
我々は、FMが1leq p leq 2$でほぼ最小の収束率を達成できることを確立し、FMが拡散モデルに匹敵する収束率に達するという最初の理論的証拠を示す。
論文 参考訳(メタデータ) (2024-05-31T14:54:51Z) - Only Tails Matter: Average-Case Universality and Robustness in the
Convex Regime [34.34747805050984]
予測スペクトル分布の端辺付近の固有値の濃度が問題の平均複雑性を決定することを示す。
平均ケースでは、ネステロフの手法は普遍的にほぼ最適であることを示す。
論文 参考訳(メタデータ) (2022-06-20T17:16:52Z) - Uniform Concentration Bounds toward a Unified Framework for Robust
Clustering [21.789311405437573]
センターベースのクラスタリングの最近の進歩は、ロイドの有名な$k$-meansアルゴリズムの欠点によって改善され続けている。
様々な手法は、ローカル・ミニマ(英語版)の貧弱さ、異常値に対する感度、ユークリッドの対応に適さないデータに対処しようとする。
本稿では,一般的な相似性尺度に基づく中心クラスタリングのための密結合型ロバストフレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-27T03:43:44Z) - Decentralized Local Stochastic Extra-Gradient for Variational
Inequalities [125.62877849447729]
我々は、不均一(非IID)で多くのデバイスに分散する問題データを持つ領域上での分散変分不等式(VIs)を考察する。
我々は、完全に分散化された計算の設定を網羅する計算ネットワークについて、非常に一般的な仮定を行う。
理論的には, モノトン, モノトンおよび非モノトンセッティングにおける収束速度を理論的に解析する。
論文 参考訳(メタデータ) (2021-06-15T17:45:51Z) - Improved Estimation of Concentration Under $\ell_p$-Norm Distance
Metrics Using Half Spaces [14.947511752748005]
測定の集中は、敵の脆弱性の根本的な原因であると議論されている。
本稿では,実験データセットの濃度を$ell_p$-norm距離で推定する手法を提案する。
提案アルゴリズムはMahloujifar et alよりも効率的です。
合成データセットと画像ベンチマークに関する我々の実験は、より厳密な内在的堅牢性境界を見つけることができることを示した。
論文 参考訳(メタデータ) (2021-03-24T01:16:28Z) - Concentration of solutions to random equations with concentration of
measure hypotheses [45.24358490877106]
固定点として暗黙的に定式化されるランダム対象の濃度を方程式 $Y = f(X)$ ここで$f$はランダム写像である。
論文 参考訳(メタデータ) (2020-10-19T21:26:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。