論文の概要: Conformal Prediction with Cellwise Outliers: A Detect-then-Impute Approach
- arxiv url: http://arxiv.org/abs/2505.04986v1
- Date: Thu, 08 May 2025 06:43:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 21:43:49.776277
- Title: Conformal Prediction with Cellwise Outliers: A Detect-then-Impute Approach
- Title(参考訳): セルワイズ・アウトリーチを用いたコンフォーマル予測:検出-then-Impute アプローチ
- Authors: Qian Peng, Yajie Bao, Haojie Ren, Zhaojun Wang, Changliang Zou,
- Abstract要約: コンフォーマル予測はブラックボックスモデルの予測間隔を構築する強力なツールである。
本稿では,検出・入力共形予測という新しいフレームワークを提案する。
我々はPDI-CPとJDI-CPの2つの実用的なアルゴリズムを開発し、分布のないカバレッジ分析を提供する。
- 参考スコア(独自算出の注目度): 4.328280329592151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conformal prediction is a powerful tool for constructing prediction intervals for black-box models, providing a finite sample coverage guarantee for exchangeable data. However, this exchangeability is compromised when some entries of the test feature are contaminated, such as in the case of cellwise outliers. To address this issue, this paper introduces a novel framework called detect-then-impute conformal prediction. This framework first employs an outlier detection procedure on the test feature and then utilizes an imputation method to fill in those cells identified as outliers. To quantify the uncertainty in the processed test feature, we adaptively apply the detection and imputation procedures to the calibration set, thereby constructing exchangeable features for the conformal prediction interval of the test label. We develop two practical algorithms, PDI-CP and JDI-CP, and provide a distribution-free coverage analysis under some commonly used detection and imputation procedures. Notably, JDI-CP achieves a finite sample $1-2\alpha$ coverage guarantee. Numerical experiments on both synthetic and real datasets demonstrate that our proposed algorithms exhibit robust coverage properties and comparable efficiency to the oracle baseline.
- Abstract(参考訳): コンフォーマル予測はブラックボックスモデルの予測間隔を構築する強力なツールであり、交換可能なデータに対して有限サンプルカバレッジを保証する。
しかし、この交換性は、セルワイド・アウトリージの場合のように、テスト機能のいくつかのエントリが汚染されたときに損なわれる。
この問題に対処するため,本研究では,検出・入力共形予測という新しいフレームワークを提案する。
このフレームワークはまず、テスト機能に外れ値検出手順を使用し、次に計算方法を用いて、外れ値として特定された細胞を埋める。
処理されたテスト特徴の不確かさを定量化するため、キャリブレーションセットに検出・計算手順を適応的に適用し、テストラベルの共形予測間隔に対する交換可能な特徴を構築する。
我々はPDI-CPとJDI-CPという2つの実用的なアルゴリズムを開発し、よく使われる検出・計算手順の下で分布のないカバレッジ解析を行う。
特に、JDI-CPは、有限サンプル1-2\alpha$カバレッジ保証を達成する。
合成データと実データの両方に関する数値実験により,提案アルゴリズムは強靭なカバレッジ特性を示し,オーラクルベースラインに匹敵する効率を示した。
関連論文リスト
- Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z) - Online scalable Gaussian processes with conformal prediction for guaranteed coverage [32.21093722162573]
結果として生じる不確実な値の整合性は、学習関数がGPモデルで指定された特性に従うという前提に基づいている。
提案するGPは,分散のない後処理フレームワークである共形予測(CP)を用いて,有意なカバレッジで予測セットを生成する。
論文 参考訳(メタデータ) (2024-10-07T19:22:15Z) - Conformal Generative Modeling with Improved Sample Efficiency through Sequential Greedy Filtering [55.15192437680943]
生成モデルは出力に対する厳密な統計的保証を欠いている。
厳密な統計的保証を満たす予測セットを生成する逐次共形予測法を提案する。
このことは、高い確率で予測セットが少なくとも1つの許容可能な(または有効な)例を含むことを保証している。
論文 参考訳(メタデータ) (2024-10-02T15:26:52Z) - Adapting Conformal Prediction to Distribution Shifts Without Labels [16.478151550456804]
コンフォーマル予測(CP)により、機械学習モデルは、保証されたカバレッジ率で予測セットを出力できる。
我々の目標は、テストドメインからのラベルなしデータのみを使用して、CP生成予測セットの品質を改善することです。
これは、未ラベルテストデータに対するベースモデルの不確実性に応じてCPのスコア関数を調整する、ECP と EACP と呼ばれる2つの新しい手法によって達成される。
論文 参考訳(メタデータ) (2024-06-03T15:16:02Z) - Confidence on the Focal: Conformal Prediction with Selection-Conditional Coverage [6.010965256037659]
コンフォーマル予測は、ランダムに描画されたテストポイントの未知の結果をカバーする、わずかに有効な予測間隔を構築する。
実際には、データ駆動手法は興味のある特定のテストユニットを特定するためにしばしば使用される。
本稿では,有限サンプルの正確なカバレッジを持つ予測セットを構築するための一般的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-03-06T17:18:24Z) - Adaptive novelty detection with false discovery rate guarantee [1.8249324194382757]
有限標本における検出された新規性に対する偽発見率(FDR)を柔軟に制御する手法を提案する。
複数のテスト文献に触発されて、nullの割合に適応するAdaDetectの変種を提案する。
これらの手法は、天体物理学の応用を含む、合成データセットと実世界のデータセットに説明される。
論文 参考訳(メタデータ) (2022-08-13T17:14:55Z) - Approximate Conditional Coverage via Neural Model Approximations [0.030458514384586396]
実験的に信頼性の高い近似条件付きカバレッジを得るためのデータ駆動手法を解析する。
我々は、限界範囲のカバレッジ保証を持つ分割型代替案で、実質的な(そして、そうでない)アンダーカバーの可能性を実証する。
論文 参考訳(メタデータ) (2022-05-28T02:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。