論文の概要: Normalizing Flows for Knockoff-free Controlled Feature Selection
- arxiv url: http://arxiv.org/abs/2106.01528v1
- Date: Thu, 3 Jun 2021 01:19:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 12:16:17.271830
- Title: Normalizing Flows for Knockoff-free Controlled Feature Selection
- Title(参考訳): ノックオフフリーな特徴選択のための正規化フロー
- Authors: Derek Hansen, Brian Manzo, Jeffrey Regier
- Abstract要約: 制御された特徴選択のためのノックオフを生成する方法は、しばしば偽発見率(FDR)を制御するのに失敗する。
両問題を修復するFlowSelectを提案する。
FlowSelectは特定の大豆形質に関連する遺伝的変異を正しく推測する。
- 参考スコア(独自算出の注目度): 4.920145245773581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of controlled feature selection is to discover the features a
response depends on while limiting the proportion of false discoveries to a
predefined level. Recently, multiple methods have been proposed that use deep
learning to generate knockoffs for controlled feature selection through the
Model-X knockoff framework. We demonstrate, however, that these methods often
fail to control the false discovery rate (FDR). There are two reasons for this
shortcoming. First, these methods often learn inaccurate models of features.
Second, the "swap" property, which is required for knockoffs to be valid, is
often not well enforced. We propose a new procedure called FlowSelect that
remedies both of these problems. To more accurately model the features,
FlowSelect uses normalizing flows, the state-of-the-art method for density
estimation. To circumvent the need to enforce the swap property, FlowSelect
uses a novel MCMC-based procedure to directly compute p-values for each
feature. Asymptotically, FlowSelect controls the FDR exactly. Empirically,
FlowSelect controls the FDR well on both synthetic and semi-synthetic
benchmarks, whereas competing knockoff-based approaches fail to do so.
FlowSelect also demonstrates greater power on these benchmarks. Additionally,
using data from a genome-wide association study of soybeans, FlowSelect
correctly infers the genetic variants associated with specific soybean traits.
- Abstract(参考訳): 制御された特徴選択の目標は、応答が依存する特徴を発見すると同時に、偽発見の割合を予め定義されたレベルに制限することである。
近年,モデルx ノックオフフレームワークによる機能選択制御のためのノックオフ生成にディープラーニングを用いた複数の手法が提案されている。
しかし、これらの手法は、しばしば偽発見率(FDR)を制御できないことを示す。
この欠点には2つの理由がある。
まず、これらの手法はしばしば不正確な特徴のモデルを学ぶ。
第二に、ノックオフが有効になるために必要な"swap"プロパティは、しばしば十分に強制されない。
本稿では,これらの問題を修復するFlowSelectという新しい手法を提案する。
より正確に特徴をモデル化するために、flowselectは密度推定の最先端手法である正規化フローを使用する。
スワッププロパティの強制を回避するため、FlowSelectはMCMCベースの新しいプロシージャを使用して各特徴のp値を直接計算する。
漸近的に、FlowSelectはFDRを正確に制御する。
実証的に、FlowSelectは合成ベンチマークと半合成ベンチマークの両方でFDRをうまく制御するが、競合するノックオフベースのアプローチではそうはならない。
FlowSelectは、これらのベンチマークでさらに力を発揮する。
さらに、大豆のゲノムワイドアソシエーション研究のデータを用いて、フローセレクトは特定の大豆形質に関連する遺伝的変異を正しく推測する。
関連論文リスト
- D-Flow: Differentiating through Flows for Controlled Generation [40.05986937727134]
フローを微分することで生成プロセスを制御するフレームワークであるD-Flowを紹介する。
我々は、ガウス確率パスで訓練された拡散/FMモデルに対して、生成過程を微分することで、データ多様体の勾配を予測できるというキーとなる観察によって、この枠組みを動機付けている。
我々は,画像と音声の逆問題や条件分子生成など,線形および非線形に制御された生成問題に対する枠組みを検証する。
論文 参考訳(メタデータ) (2024-02-21T18:56:03Z) - AdaFlow: Imitation Learning with Variance-Adaptive Flow-Based Policies [22.967735080818006]
本稿では,フローベース生成モデルに基づく模倣学習フレームワークであるAdaFlowを提案する。
AdaFlowは状態条件付き常微分方程式(ODE)によるポリシーを表す
AdaFlowは、成功率、行動多様性、推論速度など、すべての次元で高いパフォーマンスを実現していることを示す。
論文 参考訳(メタデータ) (2024-02-06T10:15:38Z) - Towards Optimal Statistical Watermarking [95.46650092476372]
仮説テスト問題として定式化して統計的透かしを研究する。
我々の定式化の鍵は、出力トークンと拒絶領域の結合である。
一般仮説テスト設定において,UMP(Uniformly Most Powerful)の透かしを特徴付ける。
論文 参考訳(メタデータ) (2023-12-13T06:57:00Z) - Towards Free Data Selection with General-Purpose Models [71.92151210413374]
望ましいデータ選択アルゴリズムは、限られたアノテーション予算の有用性を最大化するために、最も情報性の高いサンプルを効率的に選択することができる。
アクティブな学習手法で表現された現在のアプローチは、通常、時間を要するモデルのトレーニングとバッチデータ選択を繰り返し繰り返す、面倒なパイプラインに従う。
FreeSelは重いバッチ選択プロセスをバイパスし、効率を大幅に改善し、既存のアクティブラーニングメソッドよりも530倍高速である。
論文 参考訳(メタデータ) (2023-09-29T15:50:14Z) - MSFlow: Multi-Scale Flow-based Framework for Unsupervised Anomaly
Detection [124.52227588930543]
教師なし異常検出(UAD)は多くの研究の関心を集め、幅広い応用を推進している。
不明瞭だが強力な統計モデルである正規化フローは、教師なしの方法で異常検出と局所化に適している。
非対称な並列フローと融合フローからなるMSFlowと呼ばれる新しいマルチスケールフローベースフレームワークを提案する。
我々のMSFlowは、検出AUORCスコアが99.7%、ローカライゼーションAUCROCスコアが98.8%、プロスコアが97.1%の新たな最先端技術を実現している。
論文 参考訳(メタデータ) (2023-08-29T13:38:35Z) - Gleo-Det: Deep Convolution Feature-Guided Detector with Local Entropy
Optimization for Salient Points [5.955667705173262]
本稿では, 深い畳み込み特徴のガイダンスを伴い, 繰り返し可能性の要求に基づき, きめ細かな制約を実現することを提案する。
畳み込み特徴のガイダンスを用いて、正と負の両面からコスト関数を定義する。
論文 参考訳(メタデータ) (2022-04-27T12:40:21Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - GMFlow: Learning Optical Flow via Global Matching [124.57850500778277]
光フロー推定学習のためのGMFlowフレームワークを提案する。
機能拡張のためのカスタマイズトランスフォーマー、グローバル機能マッチングのための相関層とソフトマックス層、フロー伝搬のための自己保持層である。
我々の新しいフレームワークは、挑戦的なSintelベンチマークにおいて、32項目RAFTのパフォーマンスより優れています。
論文 参考訳(メタデータ) (2021-11-26T18:59:56Z) - AdaPT-GMM: Powerful and robust covariate-assisted multiple testing [0.7614628596146599]
偽発見率(FDR)制御を用いた複数検定の実証的ベイズ法を提案する。
本手法は,アダプティブp値しきい値法(AdaPT)をマスク方式の一般化により洗練する。
我々は、AdaPT-GMMと呼ばれる新しい手法が一貫して高出力を実現することを、広範囲にわたるシミュレーションと実データ例で示す。
論文 参考訳(メタデータ) (2021-06-30T05:06:18Z) - Operation-Aware Soft Channel Pruning using Differentiable Masks [51.04085547997066]
本稿では,データ駆動型アルゴリズムを提案する。このアルゴリズムは,操作特性を利用して,ディープニューラルネットワークを異なる方法で圧縮する。
我々は大規模な実験を行い、出力ネットワークの精度で優れた性能を達成する。
論文 参考訳(メタデータ) (2020-07-08T07:44:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。