論文の概要: High-Dimensional False Discovery Rate Control for Dependent Variables
- arxiv url: http://arxiv.org/abs/2401.15796v1
- Date: Sun, 28 Jan 2024 22:56:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 16:40:52.438459
- Title: High-Dimensional False Discovery Rate Control for Dependent Variables
- Title(参考訳): 従属変数に対する高次元偽発見率制御
- Authors: Jasin Machkour, Michael Muma, Daniel P. Palomar
- Abstract要約: 本稿では,変数間の依存関係構造を利用した依存性認識型T-Rexセレクタを提案する。
可変ペナル化機構がFDR制御を保証することを実証する。
グラフィカルモデルとT-Rexフレームワークのパラメータを同時に決定する完全統合最適キャリブレーションアルゴリズムを定式化する。
- 参考スコア(独自算出の注目度): 10.86851797584794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Algorithms that ensure reproducible findings from large-scale,
high-dimensional data are pivotal in numerous signal processing applications.
In recent years, multivariate false discovery rate (FDR) controlling methods
have emerged, providing guarantees even in high-dimensional settings where the
number of variables surpasses the number of samples. However, these methods
often fail to reliably control the FDR in the presence of highly dependent
variable groups, a common characteristic in fields such as genomics and
finance. To tackle this critical issue, we introduce a novel framework that
accounts for general dependency structures. Our proposed dependency-aware T-Rex
selector integrates hierarchical graphical models within the T-Rex framework to
effectively harness the dependency structure among variables. Leveraging
martingale theory, we prove that our variable penalization mechanism ensures
FDR control. We further generalize the FDR-controlling framework by stating and
proving a clear condition necessary for designing both graphical and
non-graphical models that capture dependencies. Additionally, we formulate a
fully integrated optimal calibration algorithm that concurrently determines the
parameters of the graphical model and the T-Rex framework, such that the FDR is
controlled while maximizing the number of selected variables. Numerical
experiments and a breast cancer survival analysis use-case demonstrate that the
proposed method is the only one among the state-of-the-art benchmark methods
that controls the FDR and reliably detects genes that have been previously
identified to be related to breast cancer. An open-source implementation is
available within the R package TRexSelector on CRAN.
- Abstract(参考訳): 大規模な高次元データからの再現可能な発見を保証するアルゴリズムは、多くの信号処理アプリケーションにおいて重要である。
近年,多変量偽発見率(fdr)制御手法が登場し,変数数がサンプル数を超える高次元の設定でも保証されている。
しかしながら、これらの手法は、ゲノミクスやファイナンスといった分野に共通する特徴である高依存性の可変群の存在下で、FDRを確実に制御できないことが多い。
この問題に取り組むため,我々は,一般的な依存関係構造を考慮した新しいフレームワークを提案する。
提案する依存性を考慮したT-Rexセレクタは,T-Rexフレームワーク内に階層的グラフィカルモデルを統合し,変数間の依存性構造を効果的に活用する。
マルティンゲール理論を用いて, 可変ペナリゼーション機構がfdr制御を保証することを証明した。
さらに,依存性をキャプチャするグラフィカルモデルと非グラフィックモデルの両方を設計する上で必要な明確な条件を述べ,証明することにより,fdr制御フレームワークをさらに一般化する。
さらに,選択した変数数を最大化しながらfdrを制御するように,グラフィカルモデルとt-rexフレームワークのパラメータを同時決定する完全統合最適キャリブレーションアルゴリズムを定式化する。
数値実験と乳癌生存率解析のユースケースは、fdrを制御し、以前に乳癌と同定された遺伝子を確実に検出する最先端のベンチマーク手法の中で、提案手法が唯一のものであることを示している。
オープンソース実装は、CRANのRパッケージTRexSelectorで利用可能である。
関連論文リスト
- FDR-Controlled Portfolio Optimization for Sparse Financial Index
Tracking [10.86851797584794]
高次元データ解析では、偽発見率(FDR)の制御を維持しつつ、少数の関連する変数を選択することが重要である。
我々は高相関変数の重なり合うグループに対応するためにT-Rexフレームワークを拡張した。
これは、ユーザが定義したターゲットレベルでFDRを確実に制御する、近隣のペナル化機構をフレームワークに統合することで実現される。
論文 参考訳(メタデータ) (2024-01-26T18:29:30Z) - Provable Guarantees for Generative Behavior Cloning: Bridging Low-Level
Stability and High-Level Behavior [51.60683890503293]
生成モデルを用いた複雑な専門家による実演の行動クローニングに関する理論的枠組みを提案する。
任意の専門的軌跡の時間ごとのステップ分布に一致するトラジェクトリを生成することができることを示す。
論文 参考訳(メタデータ) (2023-07-27T04:27:26Z) - Near-optimal multiple testing in Bayesian linear models with
finite-sample FDR control [11.011242089340438]
高次元変数選択問題では、統計学者はしばしば偽発見率(FDR)を制御する複数の試験手順を設計しようと試みる。
モデルが誤って特定された場合でも、有限サンプルから頻繁なFDRを確実に制御するModel-Xプロシージャを導入する。
提案手法であるPoEdCeは, 後期待, 蒸留ランダム化試験 (dCRT) , およびE値を用いたBenjamini-Hochberg法である。
論文 参考訳(メタデータ) (2022-11-04T22:56:41Z) - Probabilistic Model Incorporating Auxiliary Covariates to Control FDR [6.270317798744481]
複数の仮説テストの側面情報を活用しながら、偽発見率(FDR)を制御することは、現代のデータサイエンスにおける新たな研究トピックである。
統計的パワーを向上し,マルチハイポテーシステストのためのFDRを制御する,深いブラックボックス制御FDR(NeurT-FDR)を提案する。
我々は、NeurT-FDRが3つの実際のデータセットにおいて、競合するベースラインに比べてかなり多くの発見を行うことを示す。
論文 参考訳(メタデータ) (2022-10-06T19:35:53Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - BCDAG: An R package for Bayesian structure and Causal learning of
Gaussian DAGs [77.34726150561087]
観測データから因果関係の発見と因果関係を推定するためのRパッケージを提案する。
我々の実装は、観測回数とともに効率的にスケールし、DAGが十分にスパースであるたびに、データセット内の変数の数を削減します。
次に、実際のデータセットとシミュレーションデータセットの両方で、主な機能とアルゴリズムを説明します。
論文 参考訳(メタデータ) (2022-01-28T09:30:32Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - The Terminating-Random Experiments Selector: Fast High-Dimensional
Variable Selection with False Discovery Rate Control [10.86851797584794]
T-Rexセレクタは、ユーザ定義のターゲット偽発見率(FDR)を制御する
元の予測器とランダムに生成されたダミー予測器の複数セットの組み合わせで実験を行った。
論文 参考訳(メタデータ) (2021-10-12T14:52:46Z) - NeurT-FDR: Controlling FDR by Incorporating Feature Hierarchy [7.496622386458525]
統計力を高め、複数の仮説テストのためのFDRを制御するNeurT-FDRを提案する。
我々は、NeurT-FDRが強力なFDR保証を持ち、合成データセットと実データセットで大幅に発見することを示しています。
論文 参考訳(メタデータ) (2021-01-24T21:55:10Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z) - Distributional Robustness and Regularization in Reinforcement Learning [62.23012916708608]
経験値関数の新しい正規化器を導入し、ワッサーシュタイン分布のロバストな値関数を下限とすることを示す。
強化学習における$textitexternalな不確実性に対処するための実用的なツールとして正規化を使用することを提案する。
論文 参考訳(メタデータ) (2020-03-05T19:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。