論文の概要: Double Generative Adversarial Networks for Conditional Independence
Testing
- arxiv url: http://arxiv.org/abs/2006.02615v3
- Date: Thu, 4 Nov 2021 23:11:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 17:37:03.408564
- Title: Double Generative Adversarial Networks for Conditional Independence
Testing
- Title(参考訳): 条件付き独立テストのための二重生成対向ネットワーク
- Authors: Chengchun Shi and Tianlin Xu and Wicher Bergsma and Lexin Li
- Abstract要約: 高次元条件独立テストは統計学と機械学習の重要な構成要素である。
本稿では,GAN(Double Generative Adversarial Network)に基づく推論手法を提案する。
- 参考スコア(独自算出の注目度): 8.359770027722275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this article, we study the problem of high-dimensional conditional
independence testing, a key building block in statistics and machine learning.
We propose an inferential procedure based on double generative adversarial
networks (GANs). Specifically, we first introduce a double GANs framework to
learn two generators of the conditional distributions. We then integrate the
two generators to construct a test statistic, which takes the form of the
maximum of generalized covariance measures of multiple transformation
functions. We also employ data-splitting and cross-fitting to minimize the
conditions on the generators to achieve the desired asymptotic properties, and
employ multiplier bootstrap to obtain the corresponding $p$-value. We show that
the constructed test statistic is doubly robust, and the resulting test both
controls type-I error and has the power approaching one asymptotically. Also
notably, we establish those theoretical guarantees under much weaker and
practically more feasible conditions compared to the existing tests, and our
proposal gives a concrete example of how to utilize some state-of-the-art deep
learning tools, such as GANs, to help address a classical but challenging
statistical problem. We demonstrate the efficacy of our test through both
simulations and an application to an anti-cancer drug dataset. A Python
implementation of the proposed procedure is available at
https://github.com/tianlinxu312/dgcit.
- Abstract(参考訳): 本稿では,統計学と機械学習の重要な構成要素である高次元条件独立テストの問題点について考察する。
本稿では,GAN(Double Generative Adversarial Network)に基づく推論手法を提案する。
具体的には、条件分布の2つの生成子を学習するための2つのGANフレームワークを最初に導入する。
次に、複数の変換関数の一般化共分散測度の最大値の形をとるテスト統計を構築するために、2つの生成器を統合する。
また、データスプリットとクロスフィッティングを用いて、所望の漸近性を達成するためにジェネレータの条件を最小化し、対応する$p$-valueを得るために乗算ブートストラップを用いる。
構築されたテスト統計は二重に頑健であり、その結果、タイプiのエラーを制御し、漸近的に接近するパワーを持つ。
また,これらの理論的な保証を,既存のテストに比べてはるかに弱く,実質的に実現可能な条件下で確立し,gansなどの最先端のディープラーニングツールを用いて,古典的だが困難な統計問題に対処するための具体的な例を示す。
本試験の有効性をシミュレーションと抗がん剤データセットへの適用の両方を通して実証する。
提案されたプロシージャのPython実装はhttps://github.com/tianlinxu312/dgcitで公開されている。
関連論文リスト
- Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - A Kernel-Based Conditional Two-Sample Test Using Nearest Neighbors (with Applications to Calibration, Regression Curves, and Simulation-Based Inference) [3.622435665395788]
本稿では,2つの条件分布の違いを検出するカーネルベースの尺度を提案する。
2つの条件分布が同じである場合、推定はガウス極限を持ち、その分散はデータから容易に推定できる単純な形式を持つ。
また、条件付き適合性問題に適用可能な推定値を用いた再サンプリングベースのテストも提供する。
論文 参考訳(メタデータ) (2024-07-23T15:04:38Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Deep anytime-valid hypothesis testing [29.273915933729057]
非パラメトリックなテスト問題に対する強力なシーケンシャルな仮説テストを構築するための一般的なフレームワークを提案する。
テスト・バイ・ベッティング・フレームワーク内で、機械学習モデルの表現能力を活用するための原則的なアプローチを開発する。
合成および実世界のデータセットに関する実証的な結果は、我々の一般的なフレームワークを用いてインスタンス化されたテストが、特殊なベースラインと競合することを示している。
論文 参考訳(メタデータ) (2023-10-30T09:46:19Z) - Active Sequential Two-Sample Testing [18.99517340397671]
サンプル測定が安価に利用できる新しいシナリオでは,この2サンプルテストの問題を考慮する。
我々は,emphactiveNIST-sampleテストフレームワークを考案し,逐次クエリだけでなく,emphactivelyクエリも考案した。
実際に、我々はフレームワークのインスタンス化を導入し、いくつかの実験を用いて評価する。
論文 参考訳(メタデータ) (2023-01-30T02:23:49Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Significance tests of feature relevance for a blackbox learner [6.72450543613463]
ブラックボックス学習者の特徴関連性に関する2つの一貫した試験を導出する。
第1は、推論サンプルの摂動による損失差を評価する。
2つ目は推論サンプルを2つに分割するが、データの摂動は必要ない。
論文 参考訳(メタデータ) (2021-03-02T00:59:19Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。