論文の概要: Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables
- arxiv url: http://arxiv.org/abs/2604.11305v2
- Date: Fri, 17 Apr 2026 11:33:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 13:38:49.282687
- Title: Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables
- Title(参考訳): 固定された偽発見率を超える:E-変数によるホック後のコンフォーマル選択
- Authors: Meiyi Zhu, Osvaldo Simeone,
- Abstract要約: コンフォーマルセレクション(CS)は、キャリブレーションデータを使用して、未観測結果が所定の最小品質要件を満たす可能性のあるテスト入力を識別し、偽発見率(FDR)を制御している。
既存の方法は、データを見る前にターゲットFDRレベルを固定し、ユーザが選択したテスト入力数とFDR間のバランスを、利用可能なデータに基づいてダウンストリームのニーズと制約に適合させないようにする。
本稿では,データ駆動型偽発見率(FDP)の推定値と組み合わせて,候補選択集合の経路を生成するポストホックCS(PH-CS)を提案する。
- 参考スコア(独自算出の注目度): 31.204606769083068
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conformal selection (CS) uses calibration data to identify test inputs whose unobserved outcomes are likely to satisfy a pre-specified minimal quality requirement, while controlling the false discovery rate (FDR). Existing methods fix the target FDR level before observing data, which prevents the user from adapting the balance between number of selected test inputs and FDR to downstream needs and constraints based on the available data. For example, in genomics or neuroimaging, researchers often inspect the distribution of test statistics, and decide how aggressively to pursue candidates based on observed evidence strength and available follow-up resources. To address this limitation, we introduce {post-hoc CS} (PH-CS), which generates a path of candidate selection sets, each paired with a data-driven false discovery proportion (FDP) estimate. PH-CS lets the user select any operating point on this path by maximizing a user-specified utility, arbitrarily balancing selection size and FDR. Building on conformal e-variables and the e-Benjamini-Hochberg (e-BH) procedure, PH-CS is proved to provide a finite-sample post-hoc reliability guarantee whereby the ratio between estimated FDP level and true FDP is, on average, upper bounded by $1$, so that the average estimated FDP is, to first order, a valid upper bound on the true FDR. PH-CS is extended to control quality defined in terms of a general risk. Experiments on synthetic and real-world datasets demonstrate that, unlike CS, PH-CS can consistently satisfy user-imposed utility constraints while producing reliable FDP estimates and maintaining competitive FDR control.
- Abstract(参考訳): コンフォーマルセレクション(CS)は、キャリブレーションデータを使用して、未観測の結果が所定の最小品質要件を満たす可能性があるテスト入力を特定し、偽発見率(FDR)を制御している。
既存の方法は、データを見る前にターゲットFDRレベルを固定し、ユーザが選択したテスト入力数とFDR間のバランスを、利用可能なデータに基づいてダウンストリームのニーズと制約に適合させないようにする。
例えば、ゲノミクスやニューロイメージングでは、研究者はしばしばテスト統計の分布を調べ、観察された証拠の強さと利用可能なフォローアップリソースに基づいて、いかに積極的に候補者を追求するかを決定する。
この制限に対処するために、候補選択セットの経路を生成する {post-hoc CS} (PH-CS) を導入し、それぞれがデータ駆動型偽発見率(FDP)の推定値と組み合わせる。
PH-CSは、ユーザが指定したユーティリティを最大化し、選択サイズとFDRを任意にバランスさせることで、この経路上の任意の操作ポイントを選択することができる。
共形e-変数とe-Benjamini-Hochberg(e-BH)法に基づいて、PH-CSは、推定されたFDPレベルと真のFDPとの比率が平均1ドル上界となるような有限サンプルポストホック保証を提供することを証明した。
PH-CSは、一般的なリスクの観点から定義された品質を制御するように拡張される。
合成および実世界のデータセットに関する実験は、CSとは異なり、PH-CSは、信頼性の高いFDP推定を生成し、競争力のあるFDR制御を維持しながら、ユーザが提供するユーティリティ制約を一貫して満たすことができることを示した。
関連論文リスト
- LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems [95.35293543918762]
大規模言語モデル(LLM)はしばしば信頼できない答えを生成するが、不確実性のある手法は誤った予測と完全に区別することができない。
我々は、この問題を、偽発見率(FDR)制御のレンズを通して解決し、全ての許容された予測のうち、エラーの割合が目標のリスクレベルを超えないことを保証する。
本稿では,線形期待制約を強制することで,選択予測を制約付き決定問題として再解釈するLECを提案する。
論文 参考訳(メタデータ) (2025-12-01T11:27:09Z) - SAFER: Risk-Constrained Sample-then-Filter in Large Language Models [38.97678256807034]
本稿では,無意識サンプリングと共形フィルタリングを組み合わせた2段階リスク制御フレームワークを提案する。
その結果,SAFERはタスク固有の基準やキャリブレーションテストのスプリット比と互換性があることが判明した。
論文 参考訳(メタデータ) (2025-10-11T12:12:41Z) - High-Power Training Data Identification with Provable Statistical Guarantees [21.78494059028984]
本稿では,厳密な偽発見率(FDR)制御でトレーニングデータの集合を識別する厳密な手法であるProvable Training Data Identification (PTDI)を紹介する。
この手順により、証明可能で厳格なFDR制御と大幅なパワー向上によるトレーニングデータの発見が可能になる。
論文 参考訳(メタデータ) (2025-10-10T06:28:36Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Certifiably Byzantine-Robust Federated Conformal Prediction [49.23374238798428]
本稿では,悪意のあるクライアントに対する堅牢な共形予測を行う新しいフレームワークRob-FCPを提案する。
我々は、さまざまなビザンチン攻撃の下で、悪意のあるクライアントの多様な割合に対するRob-FCPの堅牢性を実証的に実証した。
論文 参考訳(メタデータ) (2024-06-04T04:43:30Z) - Error-based Knockoffs Inference for Controlled Feature Selection [49.99321384855201]
本手法では, ノックオフ特徴量, エラーベース特徴重要度統計量, ステップダウン手順を一体化して, エラーベースのノックオフ推定手法を提案する。
提案手法では回帰モデルを指定する必要はなく,理論的保証で特徴選択を処理できる。
論文 参考訳(メタデータ) (2022-03-09T01:55:59Z) - Post-Contextual-Bandit Inference [57.88785630755165]
コンテキストバンディットアルゴリズムは、電子商取引、医療、政策立案における非適応的なA/Bテストを置き換える傾向にある。
研究参加者の成果を改善することもでき、良い方針や最良の政策を特定できる可能性を高めることもできる。
研究の終盤における新規介入の信頼性推論を支援するため, 平均治療効果, サブグループ効果, あるいは新政策の価値について, 有効な信頼区間を構築したい。
論文 参考訳(メタデータ) (2021-06-01T12:01:51Z) - Sparse Feature Selection Makes Batch Reinforcement Learning More Sample
Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。
候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文 参考訳(メタデータ) (2020-11-08T16:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。