論文の概要: Universal consistency of Wasserstein $k$-NN classifier: Negative and
Positive Results
- arxiv url: http://arxiv.org/abs/2009.04651v4
- Date: Sun, 26 Jun 2022 18:02:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 02:59:52.964024
- Title: Universal consistency of Wasserstein $k$-NN classifier: Negative and
Positive Results
- Title(参考訳): wasserstein $k$-nn分類器の普遍的一貫性:負と正の結果
- Authors: Donlapark Ponnoprat
- Abstract要約: ワッサーシュタイン距離は確率測度の間の相同性の概念を提供する。
k$-NN分類器は、$(0,1)$でサポートされている測度空間に普遍的に整合性がないことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Wasserstein distance provides a notion of dissimilarities between
probability measures, which has recent applications in learning of structured
data with varying size such as images and text documents. In this work, we
study the $k$-nearest neighbor classifier ($k$-NN) of probability measures
under the Wasserstein distance. We show that the $k$-NN classifier is not
universally consistent on the space of measures supported in $(0,1)$. As any
Euclidean ball contains a copy of $(0,1)$, one should not expect to obtain
universal consistency without some restriction on the base metric space, or the
Wasserstein space itself. To this end, via the notion of $\sigma$-finite metric
dimension, we show that the $k$-NN classifier is universally consistent on
spaces of measures supported in a $\sigma$-uniformly discrete set. In addition,
by studying the geodesic structures of the Wasserstein spaces for $p=1$ and
$p=2$, we show that the $k$-NN classifier is universally consistent on the
space of measures supported on a finite set, the space of Gaussian measures,
and the space of measures with densities expressed as finite wavelet series.
- Abstract(参考訳): ワッサーシュタイン距離は確率測度間の相似性の概念を提供し、近年は画像や文書など様々な大きさの構造化データの学習に応用されている。
本研究では、ワッサーシュタイン距離の下での確率測度の$k$-nearest neighbor classifier(k$-NN)について検討する。
k$-NN分類器は$(0,1)$でサポートされている測度空間に普遍的に一貫しないことを示す。
任意のユークリッド球は$(0,1)$のコピーを含むので、基底距離空間やワッサーシュタイン空間自体に何らかの制限がなければ普遍整合が得られることを期待してはならない。
この目的のために、$\sigma$-finite 計量次元の概念を通じて、$k$-NN 分類器は、$\sigma$-uniformly discrete set で支えられる測度の空間に普遍的に一貫していることを示す。
さらに、ワッサーシュタイン空間の測地構造を$p=1$と$p=2$で調べることで、$k$-NN分類器は有限集合上の測度空間、ガウス測度の空間、有限ウェーブレット級数として表される密度のある測度空間に普遍的に一貫したものであることを示す。
関連論文リスト
- Dimension-free Private Mean Estimation for Anisotropic Distributions [55.86374912608193]
以前の$mathRd上の分布に関する民間推定者は、次元性の呪いに苦しむ。
本稿では,サンプルの複雑さが次元依存性を改善したアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-01T17:59:53Z) - Testing Identity of Distributions under Kolmogorov Distance in Polylogarithmic Space [1.2277343096128712]
本稿では、ストリーミング設定において、空間$O(log4 varepsilon-1)$を使用するアルゴリズムを提供する。
また、私たちは9つの関連するオープンな問題を述べ、それと関連した問題への関心を喚起することを望んでいます。
論文 参考訳(メタデータ) (2024-10-29T15:24:27Z) - Rényi divergence-based uniformity guarantees for $k$-universal hash functions [59.90381090395222]
普遍ハッシュ関数は、ソースの出力を有限アルファベット上のランダム文字列にマッピングする。
ミンエントロピーによって測定されるように、ほぼ均一なランダムビットを蒸留することが可能であることを示す。
論文 参考訳(メタデータ) (2024-10-21T19:37:35Z) - Wasserstein Gradient Flows of MMD Functionals with Distance Kernel and Cauchy Problems on Quantile Functions [2.3301643766310374]
最大平均離散関数のワッサーシュタイン勾配流について述べる: $mathcal F_nu := textMMD_K2(cdot, nu)$。
ある$mathcal F_nu$-flowsに対して、これは初期点測度がすぐに絶対連続となり、時間とともにそれを維持することを意味する。
論文 参考訳(メタデータ) (2024-08-14T12:28:21Z) - Fourier Sliced-Wasserstein Embedding for Multisets and Measures [3.396731589928944]
ユークリッド空間に$mathbbRd$を超える多重集合と測度を埋め込む新しい方法を提案する。
提案手法は,入力マルチセットの優れた表現を出力し,マルチセットデータの学習に実用的な利点をもたらすことを示す。
論文 参考訳(メタデータ) (2024-05-26T11:04:41Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - A Unified Framework for Uniform Signal Recovery in Nonlinear Generative
Compressed Sensing [68.80803866919123]
非線形測定では、ほとんどの先行結果は一様ではない、すなわち、すべての$mathbfx*$に対してではなく、固定された$mathbfx*$に対して高い確率で保持される。
本フレームワークはGCSに1ビット/一様量子化観測と単一インデックスモデルを標準例として適用する。
また、指標集合が計量エントロピーが低い製品プロセスに対して、より厳密な境界を生み出す濃度不等式も開発する。
論文 参考訳(メタデータ) (2023-09-25T17:54:19Z) - An Approximation Theory for Metric Space-Valued Functions With A View
Towards Deep Learning [25.25903127886586]
任意のポーランド計量空間 $mathcalX$ と $mathcalY$ の間の連続写像の普遍函数近似器を構築する。
特に、必要なディラック測度数は $mathcalX$ と $mathcalY$ の構造によって決定されることを示す。
論文 参考訳(メタデータ) (2023-04-24T16:18:22Z) - Parameterized Approximation Schemes for Clustering with General Norm
Objectives [0.6956677722498498]
本稿では、$(k,epsilon)$-approximationアルゴリズムを$k$-clustering問題に対して設計する、よく研究されている方式について考察する。
私たちの主な貢献は、クリーンでシンプルなEPASで、10以上のクラスタリング問題を解決しています。
論文 参考訳(メタデータ) (2023-04-06T15:31:37Z) - A Randomized Algorithm to Reduce the Support of Discrete Measures [79.55586575988292]
離散確率測度が$N$原子と$n$実数値関数の集合で成り立つと、元の$N$原子の$n+1$の部分集合で支えられる確率測度が存在する。
我々は、負の円錐によるバリセンターの簡単な幾何学的特徴付けを与え、この新しい測度を「グリード幾何学的サンプリング」によって計算するランダム化アルゴリズムを導出する。
次に、その性質を研究し、それを合成および実世界のデータにベンチマークして、$Ngg n$ regimeにおいて非常に有益であることを示す。
論文 参考訳(メタデータ) (2020-06-02T16:38:36Z) - A diffusion approach to Stein's method on Riemannian manifolds [65.36007959755302]
我々は、ターゲット不変測度を持つ$mathbf M$上の拡散の生成元と、その特徴付けStein演算子との関係を利用する。
我々は、スタイン方程式とその微分に解を束縛するスタイン因子を導出する。
我々は、$mathbf M$ が平坦多様体であるとき、$mathbb Rm$ の有界が有効であることを暗示する。
論文 参考訳(メタデータ) (2020-03-25T17:03:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。