論文の概要: A Nonparametric Test of Dependence Based on Ensemble of Decision Trees
- arxiv url: http://arxiv.org/abs/2007.12325v1
- Date: Fri, 24 Jul 2020 02:48:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 06:22:48.195706
- Title: A Nonparametric Test of Dependence Based on Ensemble of Decision Trees
- Title(参考訳): 決定木のアンサンブルに基づく非パラメトリック依存性試験
- Authors: Rami Mahdi
- Abstract要約: 提案した係数は、観測されたサンプルS_n : (X_i, Y_i), i = 1の量を定量化する置換様統計量である。
n は置換標本 S_nn : (X_i, Y_j) i, j = 1 から判別可能である。
2つの変数が独立している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, a robust non-parametric measure of statistical dependence, or
correlation, between two random variables is presented. The proposed
coefficient is a permutation-like statistic that quantifies how much the
observed sample S_n : {(X_i , Y_i), i = 1 . . . n} is discriminable from the
permutated sample ^S_nn : {(X_i , Y_j), i, j = 1 . . . n}, where the two
variables are independent. The extent of discriminability is determined using
the predictions for the, interchangeable, leave-out sample from training an
aggregate of decision trees to discriminate between the two samples without
materializing the permutated sample. The proposed coefficient is
computationally efficient, interpretable, invariant to monotonic
transformations, and has a well-approximated distribution under independence.
Empirical results show the proposed method to have a high power for detecting
complex relationships from noisy data.
- Abstract(参考訳): 本稿では,2つの確率変数間の統計的依存,あるいは相関の頑健な非パラメトリック測度について述べる。
提案した係数は、観測されたサンプル S_n : {(X_i , Y_i), i = 1 . . . n} が置換標本 ^S_nn : {(X_i , Y_j), i, j = 1 . n} とどの程度独立であるかを定量化する置換型統計量である。
識別可能性の程度は、置換されたサンプルを実体化せずに2つのサンプルを識別する決定木の集合を訓練し、交換可能な残留サンプルの予測を用いて決定される。
提案する係数は計算効率が高く, 解釈可能であり, 単調変換に不変であり, 独立性下では近似分布を持つ。
実験結果から,ノイズデータから複雑な関係を検出するための高出力な手法を提案する。
関連論文リスト
- Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文 参考訳(メタデータ) (2024-08-25T04:07:18Z) - Selective Nonparametric Regression via Testing [54.20569354303575]
本研究では,所定の点における条件分散の値に関する仮説を検証し,留置手順を開発する。
既存の手法とは異なり、提案手法は分散自体の値だけでなく、対応する分散予測器の不確実性についても考慮することができる。
論文 参考訳(メタデータ) (2023-09-28T13:04:11Z) - Detecting Adversarial Data by Probing Multiple Perturbations Using
Expected Perturbation Score [62.54911162109439]
逆方向検出は、自然分布と逆方向分布の差に基づいて、与えられたサンプルが逆方向であるかどうかを判定することを目的としている。
本研究では,様々な摂動後の標本の予測スコアであるEPS(pre expected perturbation score)を提案する。
EPSに基づく最大平均誤差(MMD)を,試験試料と自然試料との差を測定する指標として開発する。
論文 参考訳(メタデータ) (2023-05-25T13:14:58Z) - Bootstrapped Edge Count Tests for Nonparametric Two-Sample Inference
Under Heterogeneity [5.8010446129208155]
両試料間の差異を正確に検出する新しい非パラメトリック試験法を開発した。
オンラインゲームにおけるユーザ行動検出のための総合シミュレーション研究と応用により,提案試験の非漸近性能が向上したことを示す。
論文 参考訳(メタデータ) (2023-04-26T22:25:44Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Comparing two samples through stochastic dominance: a graphical approach [2.867517731896504]
実世界のシナリオでは非決定論的測定が一般的である。
推定累積分布関数に従って2つのサンプルを視覚的に比較するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-15T13:37:03Z) - The Representation Jensen-Reny\'i Divergence [0.0]
無限に分割可能なカーネルによって定義されるカーネルヒルベルト空間の再生における演算子に基づくデータ分布間の測度を導入する。
提案手法は,データに基づく確率分布の推定を回避している。
論文 参考訳(メタデータ) (2021-12-02T19:51:52Z) - Multivariate Probabilistic Regression with Natural Gradient Boosting [63.58097881421937]
多変量予測分布の条件パラメータを非パラメトリックにモデル化したNatural Gradient Boosting (NGBoost) 手法を提案する。
提案手法は頑健で, 広範囲なチューニングを伴わず, 推定対象分布に対してモジュール構造であり, 既存の手法と比較して競争力がある。
論文 参考訳(メタデータ) (2021-06-07T17:44:49Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - Posterior Ratio Estimation of Latent Variables [14.619879849533662]
いくつかのアプリケーションでは、観測から無視される確率変数の分布を比較したい。
潜在変数の2つの後続確率密度関数の比を推定する問題について検討する。
論文 参考訳(メタデータ) (2020-02-15T16:46:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。