論文の概要: Learning generative models for valid knockoffs using novel
multivariate-rank based statistics
- arxiv url: http://arxiv.org/abs/2111.00043v1
- Date: Fri, 29 Oct 2021 18:51:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-05 03:33:10.280399
- Title: Learning generative models for valid knockoffs using novel
multivariate-rank based statistics
- Title(参考訳): 新しい多変量ランク統計を用いた有効なノックオフのための生成モデル学習
- Authors: Shoaib Bin Masud, Shuchin Aeron
- Abstract要約: ランクエネルギー (RE) は、Monge's Optimal Transport (OT) 問題における最適写像を特徴付ける理論的結果を用いて導出される。
我々は、ソフトランクエネルギー(sRE)と呼ばれるREの変種と、ソフトランク最大平均誤差(sRMMD)と呼ばれるカーネル変種を提案する。
次に、sRMMDを用いて深いノックオフを生成し、有効なノックオフを生成するための新規かつ効果的な方法であることを示す。
- 参考スコア(独自算出の注目度): 12.528602250193206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of generating valid knockoffs for knockoff filtering
which is a statistical method that provides provable false discovery rate
guarantees for any model selection procedure. To this end, we are motivated by
recent advances in multivariate distribution-free goodness-of-fit tests namely,
the rank energy (RE), that is derived using theoretical results characterizing
the optimal maps in the Monge's Optimal Transport (OT) problem. However, direct
use of use RE for learning generative models is not feasible because of its
high computational and sample complexity, saturation under large support
discrepancy between distributions, and non-differentiability in generative
parameters. To alleviate these, we begin by proposing a variant of the RE,
dubbed as soft rank energy (sRE), and its kernel variant called as soft rank
maximum mean discrepancy (sRMMD) using entropic regularization of Monge's OT
problem. We then use sRMMD to generate deep knockoffs and show via extensive
evaluation that it is a novel and effective method to produce valid knockoffs,
achieving comparable, or in some cases improved tradeoffs between detection
power Vs false discoveries.
- Abstract(参考訳): 我々は,任意のモデル選択手順に対して偽発見率を保証する統計的手法であるノックオフフィルタリングに対して有効なノックオフを生成する問題を考える。
この目的のために,モンジュの最適輸送(OT)問題における最適写像を特徴付ける理論的結果を用いて導出した,多変量分布自由良性試験,すなわちランクエネルギー(RE)の最近の進歩を動機としている。
しかし, 生成モデルの学習にREを直接使用することは, 計算量やサンプル数が多いこと, 分布間の大きな支持差による飽和, 生成パラメータの非微分性などにより実現不可能である。
これらを緩和するために、モンジュのOT問題のエントロピー正規化を用いて、ソフトランクエネルギー(sRE)と呼ばれるREの変種と、そのカーネル変種をソフトランク最大平均誤差(sRMMD)として提案することから始める。
次に、深いノックオフを生成するためにsRMMDを使用し、有効なノックオフを生成したり、同等に達成したり、場合によっては検出パワーVs偽発見間のトレードオフを改善したりするための新規で効果的な方法であることを示す。
関連論文リスト
- DistPred: A Distribution-Free Probabilistic Inference Method for Regression and Forecasting [14.390842560217743]
本稿では、回帰予測タスクのためのDistPredという新しい手法を提案する。
予測分布と対象分布の差分を測定するための適切なスコアリングルールを、微分可能な離散形式に変換する。
これにより、モデルは単一のフォワードパスで多数のサンプルをサンプリングし、応答変数の潜在的分布を推定することができる。
論文 参考訳(メタデータ) (2024-06-17T10:33:00Z) - DeepDRK: Deep Dependency Regularized Knockoff for Feature Selection [14.840211139848275]
ディープ依存正規化ノックオフ(Deep Dependency Regularized Knockoff)とは、FDRと電力を効果的にバランスさせる分布自由なディープラーニング手法である。
マルチソース攻撃下での学習問題として,ノックオフモデルの新たな定式化を導入する。
我々のモデルは、合成、半合成、および実世界のデータセットで既存のベンチマークより優れています。
論文 参考訳(メタデータ) (2024-02-27T03:24:54Z) - Score-based Source Separation with Applications to Digital Communication
Signals [72.6570125649502]
拡散モデルを用いた重畳音源の分離手法を提案する。
高周波(RF)システムへの応用によって、我々は、基礎となる離散的な性質を持つ情報源に興味を持っている。
提案手法は,最近提案されたスコア蒸留サンプリング方式のマルチソース拡張と見なすことができる。
論文 参考訳(メタデータ) (2023-06-26T04:12:40Z) - Tailoring Language Generation Models under Total Variation Distance [55.89964205594829]
ニューラルネットワーク生成の標準パラダイムは、最適化方法として最大推定(MLE)を採用する。
言語生成に適用するための実践的境界を開発する。
本稿では,TVD推定のトレードオフのバランスをとるためのTaiLr の目標について紹介する。
論文 参考訳(メタデータ) (2023-02-26T16:32:52Z) - Distributionally Robust Models with Parametric Likelihood Ratios [123.05074253513935]
3つの単純なアイデアにより、より広いパラメトリックな確率比のクラスを用いてDROでモデルを訓練することができる。
パラメトリック逆数を用いてトレーニングしたモデルは、他のDROアプローチと比較して、サブポピュレーションシフトに対して一貫して頑健であることがわかった。
論文 参考訳(メタデータ) (2022-04-13T12:43:12Z) - Deblurring via Stochastic Refinement [85.42730934561101]
条件付き拡散モデルに基づくブラインドデブロアリングのための代替フレームワークを提案する。
提案手法は,PSNRなどの歪み指標の点で競合する。
論文 参考訳(メタデータ) (2021-12-05T04:36:09Z) - AdaPT-GMM: Powerful and robust covariate-assisted multiple testing [0.7614628596146599]
偽発見率(FDR)制御を用いた複数検定の実証的ベイズ法を提案する。
本手法は,アダプティブp値しきい値法(AdaPT)をマスク方式の一般化により洗練する。
我々は、AdaPT-GMMと呼ばれる新しい手法が一貫して高出力を実現することを、広範囲にわたるシミュレーションと実データ例で示す。
論文 参考訳(メタデータ) (2021-06-30T05:06:18Z) - Reducing the Amortization Gap in Variational Autoencoders: A Bayesian
Random Function Approach [38.45568741734893]
GPモデルの推論は、セミアモタイズ法よりもはるかに高速な1つのフィードフォワードパスによって行われる。
提案手法は,複数のベンチマークデータセットの最先端データよりも高い確率でテストデータが得られることを示す。
論文 参考訳(メタデータ) (2021-02-05T13:01:12Z) - DisARM: An Antithetic Gradient Estimator for Binary Latent Variables [35.473848208376886]
本稿では、バイナリ潜伏変数を持つモデルのトレーニングのためのAugment-REINFORCE-Merge (ARM) 推定器を紹介する。
拡張プロセスによって生じるランダム性を解析的に統合することにより、ARMを改善することができることを示す。
我々の推定器であるDisARMは実装が簡単で、ARMと同じ計算コストを持つ。
論文 参考訳(メタデータ) (2020-06-18T17:09:35Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。