論文の概要: Testing Independence of Exchangeable Random Variables
- arxiv url: http://arxiv.org/abs/2210.12392v1
- Date: Sat, 22 Oct 2022 08:55:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 22:03:31.633825
- Title: Testing Independence of Exchangeable Random Variables
- Title(参考訳): 交換可能なランダム変数の試験独立性
- Authors: Marcus Hutter
- Abstract要約: 十分なシャッフルデータがあれば、データ項目が統計的に(非)依存しているかどうかを判断できますか?
これは可能であることを示し、データが独立で同一に分散されているというヌル仮説を確実に拒否できるテストを開発する。
潜在的なアプリケーションはDeep Learningで、データはしばしばインターネット全体から取り除かれ、重複は多い。
- 参考スコア(独自算出の注目度): 19.973896010415977
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given well-shuffled data, can we determine whether the data items are
statistically (in)dependent? Formally, we consider the problem of testing
whether a set of exchangeable random variables are independent. We will show
that this is possible and develop tests that can confidently reject the null
hypothesis that data is independent and identically distributed and have high
power for (some) exchangeable distributions. We will make no structural
assumptions on the underlying sample space. One potential application is in
Deep Learning, where data is often scraped from the whole internet, with
duplications abound, which can render data non-iid and test-set evaluation
prone to give wrong answers.
- Abstract(参考訳): 十分なシャッフルデータがあれば、データ項目が統計的に(非)依存しているかどうかを判断できますか?
形式的には、交換可能な確率変数の集合が独立かどうかをテストする問題を考える。
データを独立かつ同一に分散し、(一部)交換可能な分布に対して高いパワーを有するというヌル仮説を確実に否定できるテストを開発することができることを示す。
基礎となるサンプル空間について構造的な仮定はしない。
ディープラーニングでは、データがインターネット全体からスクレイピングされる場合が多く、重複が多くて、データ非iidやテストセットの評価を正しくレンダリングし、誤った答を与える可能性がある。
関連論文リスト
- Federated Causal Discovery from Heterogeneous Data [70.31070224690399]
任意の因果モデルと異種データに対応する新しいFCD法を提案する。
これらのアプローチには、データのプライバシを保護するために、生データのプロキシとして要約統計を構築することが含まれる。
提案手法の有効性を示すために, 合成および実データを用いた広範囲な実験を行った。
論文 参考訳(メタデータ) (2024-02-20T18:53:53Z) - Testing multivariate normality by testing independence [0.0]
本稿では,Kac-Bernsteinの特性に基づく簡易な多変量正規化テストを提案する。
また,高次元データに対して,提案手法は代替手法よりも効率的である可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-20T07:19:52Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Non-Parametric Inference of Relational Dependence [17.76905154531867]
本研究では,関係系から引き出されたデータの独立性を推定する問題について検討する。
我々は,非観測データに対する関係独立性試験を運用するために,一貫した,非パラメトリックでスケーラブルなカーネルテストを提案する。
論文 参考訳(メタデータ) (2022-06-30T03:42:20Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Safe Tests and Always-Valid Confidence Intervals for contingency tables
and beyond [69.25055322530058]
2つのデータストリームが同じソースから来るかどうかをテストするためのE変数を開発します。
これらのE変数は、オプションの停止や継続のようなフレキシブルなサンプリングシナリオの下で、安全であり続けるテストにつながる。
論文 参考訳(メタデータ) (2021-06-04T20:12:13Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - Asymptotic Validity and Finite-Sample Properties of Approximate Randomization Tests [2.28438857884398]
我々の理論的な重要な貢献は、ノイズレスデータを用いた近似ランダム化テストのサイズと元のランダム化テストのサイズとの差に非漸近的境界を持つことである。
線形回帰における有意性のテストを含むいくつかの例を通して、我々の理論を解説する。
論文 参考訳(メタデータ) (2019-08-12T16:09:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。