論文の概要: Data-Driven Representations for Testing Independence: Modeling, Analysis
and Connection with Mutual Information Estimation
- arxiv url: http://arxiv.org/abs/2110.14122v1
- Date: Wed, 27 Oct 2021 02:06:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-28 14:01:03.128614
- Title: Data-Driven Representations for Testing Independence: Modeling, Analysis
and Connection with Mutual Information Estimation
- Title(参考訳): テスト独立のためのデータ駆動表現:相互情報推定によるモデリング、分析、接続
- Authors: Mauricio E. Gonzalez, Jorge F. Silva, Miguel Videla, and Marcos E.
Orchard
- Abstract要約: この研究は、データ駆動パーティションの設計から、2つの連続および有限次元のランダム変数の独立性をテストする。
オラクルテストの十分な統計量の近似は、データ駆動パーティションを設計するための学習基準を提供する。
いくつかの実験分析は、データ駆動表現を使用しないいくつかの戦略と比較して、テスト独立性に対する我々のスキームの利点に関する証拠を提供する。
- 参考スコア(独自算出の注目度): 3.9023554886892433
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This work addresses testing the independence of two continuous and
finite-dimensional random variables from the design of a data-driven partition.
The empirical log-likelihood statistic is adopted to approximate the sufficient
statistics of an oracle test against independence (that knows the two
hypotheses). It is shown that approximating the sufficient statistics of the
oracle test offers a learning criterion for designing a data-driven partition
that connects with the problem of mutual information estimation. Applying these
ideas in the context of a data-dependent tree-structured partition (TSP), we
derive conditions on the TSP's parameters to achieve a strongly consistent
distribution-free test of independence over the family of probabilities
equipped with a density. Complementing this result, we present finite-length
results that show our TSP scheme's capacity to detect the scenario of
independence structurally with the data-driven partition as well as new
sampling complexity bounds for this detection. Finally, some experimental
analyses provide evidence regarding our scheme's advantage for testing
independence compared with some strategies that do not use data-driven
representations.
- Abstract(参考訳): この研究は、データ駆動パーティションの設計から、2つの連続および有限次元ランダム変数の独立性をテストする。
経験的対数類似統計学は、独立性に対するオラクルテスト(二つの仮説を知っている)の十分な統計を近似するために用いられる。
オラクルテストの十分な統計を近似すると、相互情報推定の問題と結びついたデータ駆動分割を設計するための学習基準が示される。
これらの考え方をデータ依存木構造分割(TSP)の文脈で適用することにより、TSPのパラメータの条件を導出し、密度を持つ確率族に対する独立性の強い一貫した分布のないテストを実現する。
この結果を補完し,データ駆動分割による独立性のシナリオを構造的に検出するtsp方式のキャパシティと,この検出のための新たなサンプリング複雑性境界を示す有限長結果を示す。
最後に、実験的な分析によって、データ駆動表現を使用しないいくつかの戦略と比較して、テスト独立性に対する我々のスキームのアドバンテージに関する証拠を提供する。
関連論文リスト
- Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Conditional Independence Testing via Latent Representation Learning [2.566492438263125]
LCIT(Latent representation based Conditional Independence Test)は、表現学習に基づく条件付き独立テストのための新しい非パラメトリック手法である。
我々の主な貢献は、Z が与えられた X と Y の独立性をテストするための生成的枠組みの提案である。
論文 参考訳(メタデータ) (2022-09-04T07:16:03Z) - Private independence testing across two parties [21.236868468146348]
$pi$-testは、複数のパーティに分散したデータ間の統計的独立性をテストするための、プライバシ保護アルゴリズムである。
差分プライベートテストの有用性に基づいて,加法的および乗法的エラー境界を確立する。
論文 参考訳(メタデータ) (2022-07-08T02:13:05Z) - Non-Parametric Inference of Relational Dependence [17.76905154531867]
本研究では,関係系から引き出されたデータの独立性を推定する問題について検討する。
我々は,非観測データに対する関係独立性試験を運用するために,一貫した,非パラメトリックでスケーラブルなカーネルテストを提案する。
論文 参考訳(メタデータ) (2022-06-30T03:42:20Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - The UU-test for Statistical Modeling of Unimodal Data [0.20305676256390928]
一次元データセットの一様性を決定するUUテスト(Unimodal Uniform test)手法を提案する。
このアプローチのユニークな特徴は、一様性の場合、一様混合モデルという形でデータの統計モデルも提供することである。
論文 参考訳(メタデータ) (2020-08-28T08:34:28Z) - Stable Prediction via Leveraging Seed Variable [73.9770220107874]
従来の機械学習手法は、非因果変数によって誘導されるトレーニングデータにおいて、微妙に刺激的な相関を利用して予測する。
本研究では, 条件付き独立性テストに基づくアルゴリズムを提案し, 種子変数を先行変数とする因果変数を分離し, 安定な予測に採用する。
我々のアルゴリズムは、安定した予測のための最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-06-09T06:56:31Z) - Distribution Approximation and Statistical Estimation Guarantees of
Generative Adversarial Networks [82.61546580149427]
GAN(Generative Adversarial Networks)は教師なし学習において大きな成功を収めている。
本稿では,H'older空間における密度データ分布推定のためのGANの近似と統計的保証を提供する。
論文 参考訳(メタデータ) (2020-02-10T16:47:57Z) - Independence Testing for Temporal Data [14.25244839642841]
根本的な問題は、2つの時系列が関連しているかどうかである。
既存のアプローチには、パラメトリックな仮定に依存するような制限があることが多い。
本稿では,時間的データ間の独立性をテストするブロック置換を用いた時間的依存統計法を提案する。
論文 参考訳(メタデータ) (2019-08-18T17:19:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。