論文の概要: Two-stage Hypothesis Tests for Variable Interactions with FDR Control
- arxiv url: http://arxiv.org/abs/2209.00077v1
- Date: Wed, 31 Aug 2022 19:17:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 14:13:52.056904
- Title: Two-stage Hypothesis Tests for Variable Interactions with FDR Control
- Title(参考訳): fdr制御を用いた可変相互作用の2段階仮説実験
- Authors: Jingyi Duan, Yang Ning, Xi Chen, Yong Chen
- Abstract要約: 本稿では,偽発見率(FDR)を制御した2段階テスト手法を提案する。
我々の2段階の手順は古典的BH法よりも効率的であり、比較または改善された統計力を持つという総合的なシミュレーション研究を通して実証する。
- 参考スコア(独自算出の注目度): 10.750902543185802
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many scenarios such as genome-wide association studies where dependences
between variables commonly exist, it is often of interest to infer the
interaction effects in the model. However, testing pairwise interactions among
millions of variables in complex and high-dimensional data suffers from low
statistical power and huge computational cost. To address these challenges, we
propose a two-stage testing procedure with false discovery rate (FDR) control,
which is known as a less conservative multiple-testing correction.
Theoretically, the difficulty in the FDR control dues to the data dependence
among test statistics in two stages, and the fact that the number of hypothesis
tests conducted in the second stage depends on the screening result in the
first stage. By using the Cram\'er type moderate deviation technique, we show
that our procedure controls FDR at the desired level asymptotically in the
generalized linear model (GLM), where the model is allowed to be misspecified.
In addition, the asymptotic power of the FDR control procedure is rigorously
established. We demonstrate via comprehensive simulation studies that our
two-stage procedure is computationally more efficient than the classical BH
procedure, with a comparable or improved statistical power. Finally, we apply
the proposed method to a bladder cancer data from dbGaP where the scientific
goal is to identify genetic susceptibility loci for bladder cancer.
- Abstract(参考訳): 変数間の依存が一般的であるゲノムワイド・アソシエーション研究のような多くのシナリオにおいて、モデル内の相互作用効果を推測することはしばしば関心がある。
しかし、複雑・高次元データにおける数百万の変数間のペアワイズ相互作用のテストは、統計力の低下と膨大な計算コストに悩まされる。
これらの課題に対処するため、我々は偽発見率(FDR)制御による2段階テスト手順を提案し、これはより保守的な多重テスト補正として知られている。
理論的には、fdr制御の難しさはテスト統計の2段階におけるデータ依存によるものであり、第2段階における仮説試験の回数が第1段階のスクリーニング結果に依存するという事実である。
Cram\'er型中等偏差法を用いて, 一般化線形モデル(GLM)において, 所望のFDRを漸近的に制御し, モデルの誤特定を許すことを示す。
また、fdr制御手順の漸近力が厳格に確立される。
本手法は, 従来のbh法よりも計算効率が優れ, 比較, 改良された統計力を有することを総合シミュレーションにより実証する。
最後に, 膀胱癌に対する遺伝子感受性遺伝子座の同定を目的として, dbgapの膀胱癌データに適用した。
関連論文リスト
- Likelihood-Free Inference and Hierarchical Data Assimilation for Geological Carbon Storage [0.0]
炭素貯蔵のための階層型データ同化フレームワークを開発した。
モンテカルロに基づく近似ベイズ計算を用いる。
3次元リカレントR-U-Net深層学習サロゲートモデルを用いて計算コストを削減する。
論文 参考訳(メタデータ) (2024-10-20T06:15:56Z) - Near-optimal multiple testing in Bayesian linear models with
finite-sample FDR control [11.011242089340438]
高次元変数選択問題では、統計学者はしばしば偽発見率(FDR)を制御する複数の試験手順を設計しようと試みる。
モデルが誤って特定された場合でも、有限サンプルから頻繁なFDRを確実に制御するModel-Xプロシージャを導入する。
提案手法であるPoEdCeは, 後期待, 蒸留ランダム化試験 (dCRT) , およびE値を用いたBenjamini-Hochberg法である。
論文 参考訳(メタデータ) (2022-11-04T22:56:41Z) - Probabilistic Model Incorporating Auxiliary Covariates to Control FDR [6.270317798744481]
複数の仮説テストの側面情報を活用しながら、偽発見率(FDR)を制御することは、現代のデータサイエンスにおける新たな研究トピックである。
統計的パワーを向上し,マルチハイポテーシステストのためのFDRを制御する,深いブラックボックス制御FDR(NeurT-FDR)を提案する。
我々は、NeurT-FDRが3つの実際のデータセットにおいて、競合するベースラインに比べてかなり多くの発見を行うことを示す。
論文 参考訳(メタデータ) (2022-10-06T19:35:53Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Sequential Permutation Testing of Random Forest Variable Importance
Measures [68.8204255655161]
そこで本研究では、逐次置換テストと逐次p値推定を用いて、従来の置換テストに関連する高い計算コストを削減することを提案する。
シミュレーション研究の結果、シーケンシャルテストの理論的性質が当てはまることを確認した。
本手法の数値安定性を2つの応用研究で検討した。
論文 参考訳(メタデータ) (2022-06-02T20:16:50Z) - Directional FDR Control for Sub-Gaussian Sparse GLMs [4.229179009157074]
偽発見率(FDR)制御は、統計的に有意にゼロでない結果の少ない数を特定することを目的とする。
偏りのある行列ラッソ推定器を構築し、スパースGLMの最小レートオーラクル不等式による正規性を証明する。
論文 参考訳(メタデータ) (2021-05-02T05:34:32Z) - Deep Learning in current Neuroimaging: a multivariate approach with
power and type I error control but arguable generalization ability [0.158310730488265]
ディープラーニングアーキテクチャを用いた分類の統計的意義を推定する非パラメトリックフレームワークを提案する。
ラベル置換試験は, クロスバリデーション (CV) と上界補正 (RUB) を併用した再置換を検証法として提案した。
我々は, CV法とRUB法が有意レベルに近い偽陽性率と許容可能な統計的力を提供することを置換試験で発見した。
論文 参考訳(メタデータ) (2021-03-30T21:15:39Z) - Bayesian prognostic covariate adjustment [59.75318183140857]
疾患の結果に関する歴史的データは、様々な方法で臨床試験の分析に組み込むことができる。
我々は, 予測モデルからの予後スコアを用いて, 治療効果推定の効率を向上する既存の文献に基づいて構築する。
論文 参考訳(メタデータ) (2020-12-24T05:19:03Z) - Tracking disease outbreaks from sparse data with Bayesian inference [55.82986443159948]
新型コロナウイルス(COVID-19)のパンデミックは、感染発生時の感染率を推定する新たな動機を与える。
標準的な手法は、より細かいスケールで共通する部分的な観測可能性とスパースなデータに対応するのに苦労する。
原理的に部分観測可能なベイズ的枠組みを提案する。
論文 参考訳(メタデータ) (2020-09-12T20:37:33Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。