論文の概要: Concentration bounds for the empirical angular measure with statistical
learning applications
- arxiv url: http://arxiv.org/abs/2104.03966v1
- Date: Wed, 7 Apr 2021 18:41:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-04-13 00:53:20.686719
- Title: Concentration bounds for the empirical angular measure with statistical
learning applications
- Title(参考訳): 統計的学習を応用した経験的角測度の濃度境界
- Authors: St\'ephan Cl\'emen\c{c}on and Hamid Jalalzai and Anne Sabourin and
Johan Segers
- Abstract要約: 単位球面上の角測度は、極端領域におけるランダムベクトルの成分の1次依存構造を特徴づける。
最も極端な観測を破棄することは、経験的角測度の切断版をもたらす。
境界は、極端な領域に合わせた2つの統計学習手順のパフォーマンス保証を提供するために適用される。
- 参考スコア(独自算出の注目度): 4.184937307007813
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The angular measure on the unit sphere characterizes the first-order
dependence structure of the components of a random vector in extreme regions
and is defined in terms of standardized margins. Its statistical recovery is an
important step in learning problems involving observations far away from the
center. In the common situation when the components of the vector have
different distributions, the rank transformation offers a convenient and robust
way of standardizing data in order to build an empirical version of the angular
measure based on the most extreme observations. However, the study of the
sampling distribution of the resulting empirical angular measure is
challenging. It is the purpose of the paper to establish finite-sample bounds
for the maximal deviations between the empirical and true angular measures,
uniformly over classes of Borel sets of controlled combinatorial complexity.
The bounds are valid with high probability and scale essentially as the square
root of the effective sample size, up to a logarithmic factor. Discarding the
most extreme observations yields a truncated version of the empirical angular
measure for which the logarithmic factor in the concentration bound is replaced
by a factor depending on the truncation level. The bounds are applied to
provide performance guarantees for two statistical learning procedures tailored
to extreme regions of the input space and built upon the empirical angular
measure: binary classification in extreme regions through empirical risk
minimization and unsupervised anomaly detection through minimum-volume sets of
the sphere.
- Abstract(参考訳): 単位球面上の角測度は、極端領域におけるランダムベクトルの成分の1次依存構造を特徴づけ、標準化されたマージンで定義される。
その統計的回復は、中心から遠く離れた観察に関わる問題を学ぶための重要なステップである。
ベクトルの成分が異なる分布を持つ一般的な状況において、ランク変換は最も極端な観測に基づいて角測度の経験的なバージョンを構築するために、データを標準化する便利な堅牢な方法を提供する。
しかしながら、結果として得られる経験的角度の測定値のサンプリング分布の研究は困難である。
この論文の目的は、経験的測度と真の角測度の間の最大偏差に対する有限個のサンプル境界を、制御された組合せ複雑性のボレル集合のクラスに対して一様に確立することである。
境界は、有効サンプルサイズの平方根として、対数係数まで、高い確率とスケールで有効である。
最も極端な観測を破棄すると、濃度境界の対数因子が切断レベルに応じて係数に置き換えられるような経験的角測度の切断版が得られる。
この境界は、入力空間の極小領域に合わせた2つの統計学習手順のパフォーマンス保証に応用され、経験的角測度に基づく: 経験的リスク最小化による極小領域のバイナリ分類と、球の最小体積集合による教師なし異常検出である。
関連論文リスト
- Partition Function Estimation under Bounded f-Divergence [18.170877027040362]
本研究では,提案分布へのサンプルアクセスを前提とした分割関数の推定の統計的複雑さについて検討する。
本結果は, 重要サンプリング, 拒絶, サンプリング, 重み付き平均推定の事前解析を統一し, 一般化するものである。
論文 参考訳(メタデータ) (2026-02-26T22:34:36Z) - Kernel-Based Nonparametric Tests For Shape Constraints [0.0]
サンプル推定器の統計的特性を導出し、厳密な理論的保証を提供する。
有限格子上の形状制約を検証するためのWald型合同統計法を提案する。
論文 参考訳(メタデータ) (2025-10-19T08:07:33Z) - Isolation-based Spherical Ensemble Representations for Anomaly Detection [60.989157958972356]
不正検出、ネットワークセキュリティ、ログ監視を対象とするアプリケーションによるデータマイニングと管理において、異常検出は重要なタスクである。
既存の教師なし異常検出手法は、分散仮定の矛盾、計算の非効率性、異なる異常型を扱う難しさなど、基本的な課題に直面している。
Isolation-based Spherical Ensemble Representations (ISER) は, 局所密度特性のプロキシとしてハイパースフィアラジイを用いて, 線形時間と定数空間の複雑さを保ちながら, 既存の分離法を拡張したものである。
論文 参考訳(メタデータ) (2025-10-15T09:00:05Z) - Inference on covariance structure in high-dimensional multi-view data [8.549941732144035]
後続計算は、高価で脆いマルコフ連鎖モンテカルロサンプリングまたは変分近似によって行われる。
提案手法は,少なくとも1つの視点で有効である潜在因子を推定・調整するためにスペクトル分解を用いる。
正確な不確実性を含むシミュレーションにおいて優れた性能を示し、がん細胞サンプルのマルチオミクスデータセットから4つの高次元ビューを統合する手法を適用した。
論文 参考訳(メタデータ) (2025-09-02T19:20:42Z) - Assessing One-Dimensional Cluster Stability by Extreme-Point Trimming [0.0]
本研究では, 一次元試料のテール挙動と幾何学的安定性を評価するための確率的手法を開発した。
有限サンプル補正を含む解析式は、一様仮説とガウス仮説の両方の下で期待される縮退について導出する。
我々はさらにクラスタリングパイプライン(DBSCANなど)に統合し、密度推定やパラメータチューニングなしに1次元のクラスタを検証する能力を示す。
論文 参考訳(メタデータ) (2025-08-29T21:52:15Z) - Statistical Inference in Classification of High-dimensional Gaussian Mixture [1.2354076490479515]
高次元極限における正規化凸分類器の一般クラスの挙動について検討する。
我々の焦点は、推定器の一般化誤差と変数選択性である。
論文 参考訳(メタデータ) (2024-10-25T19:58:36Z) - Weighted Riesz Particles [0.0]
対象分布を、パラメータの無限次元空間が多くの決定論的部分多様体からなる写像と考える。
我々は、Rieszと呼ばれる点の性質を研究し、それをシーケンシャルMCMCに埋め込む。
低い評価で高い受け入れ率が得られることが分かりました。
論文 参考訳(メタデータ) (2023-12-01T14:36:46Z) - Optimizing detection of continuous variable entanglement for limited
data [0.0]
我々は、フシミ$Q$分布の値が位相空間の点の格子上でのみ知られているような粗粒度測定(有限検出器分解)のシナリオを考える。
我々は、与えられた有限個のサンプルに対する検出の統計的意義を最大化するために、我々の絡み合い基準をカスタマイズする。
論文 参考訳(メタデータ) (2022-11-30T17:05:08Z) - Targeted Separation and Convergence with Kernel Discrepancies [61.973643031360254]
カーネルベースの不一致測度は、(i)ターゲットPを他の確率測度から分離するか、(ii)Pへの弱収束を制御する必要がある。
本稿では, (i) と (ii) を保証するのに十分な,必要な新しい条件を導出する。
可分距離空間上のMDDに対して、ボヒナー埋め込み可測度を分離するカーネルを特徴づけ、すべての測度を非有界カーネルと分離するための単純な条件を導入する。
論文 参考訳(メタデータ) (2022-09-26T16:41:16Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Spectral learning of multivariate extremes [0.0]
多変量極度の依存構造を解析するためのスペクトルクラスタリングアルゴリズムを提案する。
本研究は,極端サンプルから構築したランダムな$k-アネレスト近傍グラフに基づくスペクトルクラスタリングの理論的性能について検討した。
角測度を学習するための簡易な一貫した推定手法を提案する。
論文 参考訳(メタデータ) (2021-11-15T14:33:06Z) - Nearest neighbor empirical processes [7.034466417392574]
近辺から所与の点$x$への応答に基づく実証測度を導入し、中央統計量として研究する。
均一な非漸近境界は、一様エントロピー数上でよく知られた条件の下で成立し、しばしばVapnik-Chervonenkis (Vapnik-Chervonenkis) と呼ばれる。
これは、標準公式を用いて、全データの代わりに最も近い隣人だけを用いて分散を推定できる可能性を示唆している。
論文 参考訳(メタデータ) (2021-10-27T08:15:20Z) - Spectral clustering under degree heterogeneity: a case for the random
walk Laplacian [83.79286663107845]
本稿では,ランダムウォークラプラシアンを用いたグラフスペクトル埋め込みが,ノード次数に対して完全に補正されたベクトル表現を生成することを示す。
次数補正ブロックモデルの特別な場合、埋め込みはK個の異なる点に集中し、コミュニティを表す。
論文 参考訳(メタデータ) (2021-05-03T16:36:27Z) - Benign Overfitting of Constant-Stepsize SGD for Linear Regression [122.70478935214128]
帰納バイアスは 経験的に過剰フィットを防げる中心的存在です
この研究は、この問題を最も基本的な設定として考慮している: 線形回帰に対する定数ステップサイズ SGD。
我々は、(正規化されていない)SGDで得られるアルゴリズム正則化と、通常の最小二乗よりも多くの顕著な違いを反映する。
論文 参考訳(メタデータ) (2021-03-23T17:15:53Z) - Log-Likelihood Ratio Minimizing Flows: Towards Robust and Quantifiable
Neural Distribution Alignment [52.02794488304448]
そこで本研究では,対数様比統計量と正規化フローに基づく新しい分布アライメント手法を提案する。
入力領域の局所構造を保存する領域アライメントにおいて,結果の最小化を実験的に検証する。
論文 参考訳(メタデータ) (2020-03-26T22:10:04Z) - Semiparametric Nonlinear Bipartite Graph Representation Learning with
Provable Guarantees [106.91654068632882]
半パラメトリック指数族分布におけるパラメータの統計的推定問題として、両部グラフを考察し、その表現学習問題を定式化する。
提案手法は, 地中真理付近で強い凸性を示すため, 勾配降下法が線形収束率を達成できることを示す。
我々の推定器は指数族内の任意のモデル誤特定に対して頑健であり、広範な実験で検証されている。
論文 参考訳(メタデータ) (2020-03-02T16:40:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。