論文の概要: Everywhere Valid Bounds on False Discovery Proportions in Conformal Inference
- arxiv url: http://arxiv.org/abs/2605.20726v1
- Date: Wed, 20 May 2026 05:24:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.492304
- Title: Everywhere Valid Bounds on False Discovery Proportions in Conformal Inference
- Title(参考訳): 等角的推論における偽発見確率の有意な境界
- Authors: Ziang Song, Ying Jin, Emmanuel J. Candès,
- Abstract要約: 共形推論は、共形p値がしきい値以下になるテストサンプルを選択するためにしばしば用いられる。
このような手法の質は、しばしば誤った選択の分数として定義される偽発見率(FDP)によって測定される。
本稿では、FDP上の有限サンプル分布のない上界を、可能なすべての拒絶しきい値に対して同時に保持する。
- 参考スコア(独自算出の注目度): 19.796377044066286
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern applications of conformal inference to multiple testing problems, such as outlier detection and candidate selection, often involve selecting test samples whose conformal p-values fall below a threshold. The quality of such methods is often measured by the false discovery proportion (FDP), defined as the fraction of incorrect selections. Existing approaches typically control the expected value of the FDP, using methods such as the Benjamini-Hochberg procedure. This approach fails to provide high-probability bounds on the realized false discovery proportion and invalidates statistical guarantees if the rejection threshold is selected after inspecting the data. This paper establishes finite-sample, distribution-free upper bounds on the FDP that hold simultaneously over all possible rejection thresholds, enabling arbitrary post hoc selection of the threshold. Simultaneous validity is achieved by constructing a high-probability envelope for the empirical distribution function of null conformal p-values by sampling from their joint distribution. Furthermore, our framework allows practitioners to modulate the envelope's shape, thereby producing tight bounds in rejection regions of primary interest. We use this flexible approach to derive simultaneous FDP upper bounds for both outlier detection and conformal selection. We demonstrate through synthetic and real-data experiments that the resulting bounds are both valid and substantially less conservative than those derived from existing approaches.
- Abstract(参考訳): 異常検出や候補選択といった複数のテスト問題に対する共形推論の現代的な応用は、しばしば、共形p値がしきい値を下回るテストサンプルを選択することを含む。
このような手法の質は、しばしば誤った選択の分数として定義される偽発見率(FDP)によって測定される。
既存のアプローチは典型的には、ベンジャミン・ホックバーグ手順のような手法を用いて、FDPの期待値を制御する。
このアプローチは、実現された偽発見比率に高い確率境界を与えず、データ検査後に拒絶しきい値が選択された場合、統計的保証を無効にする。
本稿では、FDP上の有限サンプル分布のない上界を、可能なすべての拒絶しきい値に対して同時に保持し、しきい値の任意のポストホック選択を可能にする。
結合分布からサンプリングすることで、Null共形p値の実験的分布関数に対する高確率エンベロープを構築することにより、同時妥当性を実現する。
さらに,本フレームワークでは,実践者が封筒の形状を調節し,一次関心の拒絶領域に厳密な境界を生じさせる。
我々は、このフレキシブルアプローチを用いて、外乱検出と共形選択の両方に同時にFDP上界を導出する。
合成および実データ実験を通して、得られた境界は、既存のアプローチから派生したものよりも有効であり、保守的でないことを実証する。
関連論文リスト
- Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables [31.204606769083068]
コンフォーマルセレクション(CS)は、キャリブレーションデータを使用して、未観測結果が所定の最小品質要件を満たす可能性のあるテスト入力を識別し、偽発見率(FDR)を制御している。
既存の方法は、データを見る前にターゲットFDRレベルを固定し、ユーザが選択したテスト入力数とFDR間のバランスを、利用可能なデータに基づいてダウンストリームのニーズと制約に適合させないようにする。
本稿では,データ駆動型偽発見率(FDP)の推定値と組み合わせて,候補選択集合の経路を生成するポストホックCS(PH-CS)を提案する。
論文 参考訳(メタデータ) (2026-04-13T11:02:44Z) - LEC: Linear Expectation Constraints for False-Discovery Control in Selective Prediction and Routing Systems [95.35293543918762]
大規模言語モデル(LLM)はしばしば信頼できない答えを生成するが、不確実性のある手法は誤った予測と完全に区別することができない。
我々は、この問題を、偽発見率(FDR)制御のレンズを通して解決し、全ての許容された予測のうち、エラーの割合が目標のリスクレベルを超えないことを保証する。
本稿では,線形期待制約を強制することで,選択予測を制約付き決定問題として再解釈するLECを提案する。
論文 参考訳(メタデータ) (2025-12-01T11:27:09Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - A Sample Efficient Conditional Independence Test in the Presence of Discretization [54.047334792855345]
離散化されたデータに直接条件付き独立テスト(CI)は、誤った結論につながる可能性がある。
最近の進歩は、観測データをバイナライズすることで、潜伏変数間の適切なCI関係を推測することを目指している。
そこで本研究では,バイナライゼーションプロセスに依存しないサンプル効率のCIテストを提案する。
論文 参考訳(メタデータ) (2025-06-10T12:41:26Z) - Conditional Testing based on Localized Conformal p-values [5.6779147365057305]
我々は、予測区間を反転させて局所化された共形p値を定義し、それらの理論的性質を証明した。
これらの定義されたp-値は、その実用性を説明するためにいくつかの条件付きテスト問題に適用される。
論文 参考訳(メタデータ) (2024-09-25T11:30:14Z) - Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-07-01T20:44:48Z) - Mitigating LLM Hallucinations via Conformal Abstention [70.83870602967625]
我々は,大言語モデルが一般ドメインでの応答をいつ無視すべきかを決定するための,原則化された手順を開発する。
我々は、幻覚率(エラー率)の厳密な理論的保証の恩恵を受けるため、共形予測手法を活用して、禁忌手順を開発する。
実験によって得られた共形禁忌法は, 種々の閉書, オープンドメイン生成質問応答データセットに, 幻覚率を確実に拘束する。
論文 参考訳(メタデータ) (2024-04-04T11:32:03Z) - Testing for Outliers with Conformal p-values [14.158078752410182]
目標は、新しい独立したサンプルが参照データセットと同じ分布に属するかどうかをテストすることである。
そこで本論文では,p-値が有意であるが,異なるテストポイントに対して互いに依存する,広く適用可能なフレームワークである共形推論に基づく解を提案する。
我々は、これらのp値が正に依存し、正確な誤発見率制御を可能にすることを証明している。
論文 参考訳(メタデータ) (2021-04-16T17:59:21Z) - Sparse Feature Selection Makes Batch Reinforcement Learning More Sample
Efficient [62.24615324523435]
本稿では,スパース線形関数近似を用いた高次元バッチ強化学習(RL)の統計的解析を行う。
候補となる機能が多数存在する場合,提案手法がバッチRLをより効率的にサンプリングできるという事実に光を当てる。
論文 参考訳(メタデータ) (2020-11-08T16:48:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。