論文の概要: Concentration bounds for the empirical angular measure with statistical
learning applications
- arxiv url: http://arxiv.org/abs/2104.03966v1
- Date: Wed, 7 Apr 2021 18:41:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-13 00:53:20.686719
- Title: Concentration bounds for the empirical angular measure with statistical
learning applications
- Title(参考訳): 統計的学習を応用した経験的角測度の濃度境界
- Authors: St\'ephan Cl\'emen\c{c}on and Hamid Jalalzai and Anne Sabourin and
Johan Segers
- Abstract要約: 単位球面上の角測度は、極端領域におけるランダムベクトルの成分の1次依存構造を特徴づける。
最も極端な観測を破棄することは、経験的角測度の切断版をもたらす。
境界は、極端な領域に合わせた2つの統計学習手順のパフォーマンス保証を提供するために適用される。
- 参考スコア(独自算出の注目度): 4.184937307007813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The angular measure on the unit sphere characterizes the first-order
dependence structure of the components of a random vector in extreme regions
and is defined in terms of standardized margins. Its statistical recovery is an
important step in learning problems involving observations far away from the
center. In the common situation when the components of the vector have
different distributions, the rank transformation offers a convenient and robust
way of standardizing data in order to build an empirical version of the angular
measure based on the most extreme observations. However, the study of the
sampling distribution of the resulting empirical angular measure is
challenging. It is the purpose of the paper to establish finite-sample bounds
for the maximal deviations between the empirical and true angular measures,
uniformly over classes of Borel sets of controlled combinatorial complexity.
The bounds are valid with high probability and scale essentially as the square
root of the effective sample size, up to a logarithmic factor. Discarding the
most extreme observations yields a truncated version of the empirical angular
measure for which the logarithmic factor in the concentration bound is replaced
by a factor depending on the truncation level. The bounds are applied to
provide performance guarantees for two statistical learning procedures tailored
to extreme regions of the input space and built upon the empirical angular
measure: binary classification in extreme regions through empirical risk
minimization and unsupervised anomaly detection through minimum-volume sets of
the sphere.
- Abstract(参考訳): 単位球面上の角測度は、極端領域におけるランダムベクトルの成分の1次依存構造を特徴づけ、標準化されたマージンで定義される。
その統計的回復は、中心から遠く離れた観察に関わる問題を学ぶための重要なステップである。
ベクトルの成分が異なる分布を持つ一般的な状況において、ランク変換は最も極端な観測に基づいて角測度の経験的なバージョンを構築するために、データを標準化する便利な堅牢な方法を提供する。
しかしながら、結果として得られる経験的角度の測定値のサンプリング分布の研究は困難である。
この論文の目的は、経験的測度と真の角測度の間の最大偏差に対する有限個のサンプル境界を、制御された組合せ複雑性のボレル集合のクラスに対して一様に確立することである。
境界は、有効サンプルサイズの平方根として、対数係数まで、高い確率とスケールで有効である。
最も極端な観測を破棄すると、濃度境界の対数因子が切断レベルに応じて係数に置き換えられるような経験的角測度の切断版が得られる。
この境界は、入力空間の極小領域に合わせた2つの統計学習手順のパフォーマンス保証に応用され、経験的角測度に基づく: 経験的リスク最小化による極小領域のバイナリ分類と、球の最小体積集合による教師なし異常検出である。
関連論文リスト
- Statistical Inference in Classification of High-dimensional Gaussian Mixture [1.2354076490479515]
高次元極限における正規化凸分類器の一般クラスの挙動について検討する。
我々の焦点は、推定器の一般化誤差と変数選択性である。
論文 参考訳(メタデータ) (2024-10-25T19:58:36Z) - Weighted Riesz Particles [0.0]
対象分布を、パラメータの無限次元空間が多くの決定論的部分多様体からなる写像と考える。
我々は、Rieszと呼ばれる点の性質を研究し、それをシーケンシャルMCMCに埋め込む。
低い評価で高い受け入れ率が得られることが分かりました。
論文 参考訳(メタデータ) (2023-12-01T14:36:46Z) - Optimizing detection of continuous variable entanglement for limited
data [0.0]
我々は、フシミ$Q$分布の値が位相空間の点の格子上でのみ知られているような粗粒度測定(有限検出器分解)のシナリオを考える。
我々は、与えられた有限個のサンプルに対する検出の統計的意義を最大化するために、我々の絡み合い基準をカスタマイズする。
論文 参考訳(メタデータ) (2022-11-30T17:05:08Z) - Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文 参考訳(メタデータ) (2022-09-26T16:41:16Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Spectral learning of multivariate extremes [0.0]
多変量極度の依存構造を解析するためのスペクトルクラスタリングアルゴリズムを提案する。
本研究は,極端サンプルから構築したランダムな$k-アネレスト近傍グラフに基づくスペクトルクラスタリングの理論的性能について検討した。
角測度を学習するための簡易な一貫した推定手法を提案する。
論文 参考訳(メタデータ) (2021-11-15T14:33:06Z) - Nearest neighbor empirical processes [7.034466417392574]
近辺から所与の点$x$への応答に基づく実証測度を導入し、中央統計量として研究する。
均一な非漸近境界は、一様エントロピー数上でよく知られた条件の下で成立し、しばしばVapnik-Chervonenkis (Vapnik-Chervonenkis) と呼ばれる。
これは、標準公式を用いて、全データの代わりに最も近い隣人だけを用いて分散を推定できる可能性を示唆している。
論文 参考訳(メタデータ) (2021-10-27T08:15:20Z) - Spectral clustering under degree heterogeneity: a case for the random
walk Laplacian [83.79286663107845]
本稿では,ランダムウォークラプラシアンを用いたグラフスペクトル埋め込みが,ノード次数に対して完全に補正されたベクトル表現を生成することを示す。
次数補正ブロックモデルの特別な場合、埋め込みはK個の異なる点に集中し、コミュニティを表す。
論文 参考訳(メタデータ) (2021-05-03T16:36:27Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z) - Log-Likelihood Ratio Minimizing Flows: Towards Robust and Quantifiable
Neural Distribution Alignment [52.02794488304448]
そこで本研究では,対数様比統計量と正規化フローに基づく新しい分布アライメント手法を提案する。
入力領域の局所構造を保存する領域アライメントにおいて,結果の最小化を実験的に検証する。
論文 参考訳(メタデータ) (2020-03-26T22:10:04Z) - Semiparametric Nonlinear Bipartite Graph Representation Learning with
Provable Guarantees [106.91654068632882]
半パラメトリック指数族分布におけるパラメータの統計的推定問題として、両部グラフを考察し、その表現学習問題を定式化する。
提案手法は, 地中真理付近で強い凸性を示すため, 勾配降下法が線形収束率を達成できることを示す。
我々の推定器は指数族内の任意のモデル誤特定に対して頑健であり、広範な実験で検証されている。
論文 参考訳(メタデータ) (2020-03-02T16:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。