論文の概要: On Ranking-based Tests of Independence
- arxiv url: http://arxiv.org/abs/2403.07464v1
- Date: Tue, 12 Mar 2024 10:00:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 22:13:42.677360
- Title: On Ranking-based Tests of Independence
- Title(参考訳): ランキングに基づく独立試験について
- Authors: Myrto Limnios (UCPH), St\'ephan Cl\'emen\c{c}on (LTCI, IDS, S2A, IP
Paris)
- Abstract要約: 2つの確率変数 $mathbfX$ と $mathbfY$ の独立性をテストするための新しい非パラメトリックフレームワークを開発する。
我々は、ROC空間の対角線から逸脱して独立性テストを構築する様々な方法を含む幅広い階級統計を考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we develop a novel nonparametric framework to test the
independence of two random variables $\mathbf{X}$ and $\mathbf{Y}$ with unknown
respective marginals $H(dx)$ and $G(dy)$ and joint distribution $F(dx dy)$,
based on {\it Receiver Operating Characteristic} (ROC) analysis and bipartite
ranking. The rationale behind our approach relies on the fact that, the
independence hypothesis $\mathcal{H}\_0$ is necessarily false as soon as the
optimal scoring function related to the pair of distributions $(H\otimes G,\;
F)$, obtained from a bipartite ranking algorithm, has a ROC curve that deviates
from the main diagonal of the unit square.We consider a wide class of rank
statistics encompassing many ways of deviating from the diagonal in the ROC
space to build tests of independence. Beyond its great flexibility, this new
method has theoretical properties that far surpass those of its competitors.
Nonasymptotic bounds for the two types of testing errors are established. From
an empirical perspective, the novel procedure we promote in this paper exhibits
a remarkable ability to detect small departures, of various types, from the
null assumption $\mathcal{H}_0$, even in high dimension, as supported by the
numerical experiments presented here.
- Abstract(参考訳): 本稿では,2つの確率変数$\mathbf{x}$ と $\mathbf{y}$ の独立性をテストするための新しい非パラメトリックフレームワークを開発し,未知の辺数 $h(dx)$ と $g(dy)$ とジョイント分布 $f(dx dy)$ を,roc解析と二成分ランキングに基づいて検証する。
このアプローチの背景にある根拠は、二部ランキングアルゴリズムから得られる一対の分布に関連する最適なスコアリング関数である$(h\otimes g,\; f)$ が単位正方形の主対角から逸脱するroc曲線を持つとき、独立性仮説 $\mathcal{h}\_0$ が必ずしも偽であるという事実である。
優れた柔軟性に加えて、この新しい手法は競合相手をはるかに上回る理論的性質を持つ。
2種類のテストエラーに対する非漸近境界が確立される。
実験的な観点から,本論文では, 数値実験で裏付けられたような, 高次元においても, null 仮定 $\mathcal{H}_0$ から, 様々な種類の小さな出発を検出できる顕著な手法を示す。
関連論文リスト
- Detection of Correlated Random Vectors [7.320365821066746]
2つのランダムベクトル $mathsfXinmathbbRn$ と $mathsfYinmathbbRn$ は相関するか否かは問わない。
最適テストが情報理論的に不可能で可能なしきい値を分析する。
論文 参考訳(メタデータ) (2024-01-24T12:58:08Z) - Testing Dependency of Unlabeled Databases [5.384630221560811]
2つのランダムデータベース $mathsfXinmathcalXntimes d$ と $mathsfYinmathcalYntimes d$ は統計的に依存するかどうかによって異なる。
最適テストが情報理論上不可能かつ可能なしきい値の特徴付けを行う。
論文 参考訳(メタデータ) (2023-11-10T05:17:03Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Statistical Learning under Heterogeneous Distribution Shift [71.8393170225794]
ground-truth predictor is additive $mathbbE[mathbfz mid mathbfx,mathbfy] = f_star(mathbfx) +g_star(mathbfy)$.
論文 参考訳(メタデータ) (2023-02-27T16:34:21Z) - Testing distributional assumptions of learning algorithms [5.204779946147061]
テストレーナー対 $(mathcalA,mathcalT)$ の設計について検討する。
データ中の例の分布がテスタを$mathcalT$に渡せば、データ上の非依存な$mathcalA$の出力を安全に信頼できることを示す。
論文 参考訳(メタデータ) (2022-04-14T19:10:53Z) - High Probability Bounds for a Class of Nonconvex Algorithms with AdaGrad
Stepsize [55.0090961425708]
本研究では,AdaGradのスムーズな非確率問題に対する簡易な高確率解析法を提案する。
我々はモジュラーな方法で解析を行い、決定論的設定において相補的な$mathcal O (1 / TT)$収束率を得る。
我々の知る限りでは、これは真に適応的なスキームを持つAdaGradにとって初めての高い確率である。
論文 参考訳(メタデータ) (2022-04-06T13:50:33Z) - An $\ell^p$-based Kernel Conditional Independence Test [21.689461247198388]
そこで本稿では, 最適分布の2つのカーネルベース代表者間の距離を$Lp$とする, 条件付き独立性のための計算効率の高い新しいテストを提案する。
我々は,新しい試験の性能が,高次元設定においても,統計的パワーとタイプI誤差の両方の観点から,最先端の手法よりも優れていることを示す一連の実験を行った。
論文 参考訳(メタデータ) (2021-10-28T03:18:27Z) - Optimal Robust Linear Regression in Nearly Linear Time [97.11565882347772]
学習者が生成モデル$Y = langle X,w* rangle + epsilon$から$n$のサンプルにアクセスできるような高次元頑健な線形回帰問題について検討する。
i) $X$ is L4-L2 hypercontractive, $mathbbE [XXtop]$ has bounded condition number and $epsilon$ has bounded variance, (ii) $X$ is sub-Gaussian with identity second moment and $epsilon$ is
論文 参考訳(メタデータ) (2020-07-16T06:44:44Z) - Sample Complexity of Asynchronous Q-Learning: Sharper Analysis and
Variance Reduction [63.41789556777387]
非同期Q-ラーニングはマルコフ決定過程(MDP)の最適行動値関数(またはQ-関数)を学習することを目的としている。
Q-関数の入出力$varepsilon$-正確な推定に必要なサンプルの数は、少なくとも$frac1mu_min (1-gamma)5varepsilon2+ fract_mixmu_min (1-gamma)$の順である。
論文 参考訳(メタデータ) (2020-06-04T17:51:00Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z) - Optimal rates for independence testing via $U$-statistic permutation
tests [7.090165638014331]
独立分布と同一分布のペアが$sigma$-finiteで分離可能な測度空間で値を取る独立性テストの問題について検討する。
最初に、独立性の有効なテストはなく、$f: D(f) geq rho2 $ という形の代替と一様に一致していることを示す。
論文 参考訳(メタデータ) (2020-01-15T19:04:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。