論文の概要: Fundamental bounds on efficiency-confidence trade-off for transductive conformal prediction
- arxiv url: http://arxiv.org/abs/2509.04631v1
- Date: Thu, 04 Sep 2025 19:49:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-08 14:27:25.3973
- Title: Fundamental bounds on efficiency-confidence trade-off for transductive conformal prediction
- Title(参考訳): 帰納的共形予測のための効率信頼トレードオフに関する基礎的境界
- Authors: Arash Behboodi, Alvaro H. C. Correia, Fabio Valerio Massoli, Christos Louizos,
- Abstract要約: トランスダクティブ手法における信頼性と効率の基本的なトレードオフを実証する。
非自明な信頼度は、不確実性のあるデータに対する予測セットサイズが指数関数的に増加することを示す。
- 参考スコア(独自算出の注目度): 20.813562569312186
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Transductive conformal prediction addresses the simultaneous prediction for multiple data points. Given a desired confidence level, the objective is to construct a prediction set that includes the true outcomes with the prescribed confidence. We demonstrate a fundamental trade-off between confidence and efficiency in transductive methods, where efficiency is measured by the size of the prediction sets. Specifically, we derive a strict finite-sample bound showing that any non-trivial confidence level leads to exponential growth in prediction set size for data with inherent uncertainty. The exponent scales linearly with the number of samples and is proportional to the conditional entropy of the data. Additionally, the bound includes a second-order term, dispersion, defined as the variance of the log conditional probability distribution. We show that this bound is achievable in an idealized setting. Finally, we examine a special case of transductive prediction where all test data points share the same label. We show that this scenario reduces to the hypothesis testing problem with empirically observed statistics and provide an asymptotically optimal confidence predictor, along with an analysis of the error exponent.
- Abstract(参考訳): 帰納的共形予測は、複数のデータポイントの同時予測に対処する。
望ましい信頼レベルが与えられたら、その目標は、所定の信頼度で真の結果を含む予測セットを構築することである。
予測セットのサイズによって効率を計測するトランスダクティブ手法において,信頼性と効率の基本的なトレードオフを示す。
具体的には、厳密な有限サンプル境界から、任意の非自明な信頼レベルが、固有の不確実性を持つデータに対する予測セットサイズを指数関数的に増加させることを示す。
指数はサンプル数と線形にスケールし、データの条件エントロピーに比例する。
さらに、境界は対数条件確率分布の分散として定義される二階項、分散を含む。
この境界は理想的な設定で達成可能であることを示す。
最後に、全てのテストデータポイントが同一ラベルを共有するようなトランスダクティブ予測の特殊な事例について検討する。
このシナリオは、経験的に観測された統計量を用いた仮説テスト問題に還元され、漸近的に最適な信頼度予測器が、誤差指数の分析とともに提供されることを示す。
関連論文リスト
- Pointwise confidence estimation in the non-linear $\ell^2$-regularized least squares [12.352761060862072]
固定設計による $ell2$-regularized 非線形最小二乗集合の高確率非漸近信頼度推定について検討する。
つまり、任意の固定テスト入力に対して$x$の予測を保持することを意味する。
論文 参考訳(メタデータ) (2025-06-08T11:23:49Z) - Credal Prediction based on Relative Likelihood [24.307076055306148]
本稿では,相対可能性の統計的概念に基づいて,断裂予測に関する理論的基礎的アプローチを提案する。
このような方法で定義されたクレダル集合を適切に修正したアンサンブル学習手法により近似する問題に取り組む。
論文 参考訳(メタデータ) (2025-05-28T13:20:20Z) - Generative Conformal Prediction with Vectorized Non-Conformity Scores [6.059745771017814]
コンフォーマル予測は、保証されたカバレッジでモデルに依存しない不確実性定量化を提供する。
ベクトル化された非整合性スコアを持つ生成共形予測フレームワークを提案する。
我々は密度ランクの不確かさ球を用いた適応不確かさ集合を構築する。
論文 参考訳(メタデータ) (2024-10-17T16:37:03Z) - Provably Reliable Conformal Prediction Sets in the Presence of Data Poisoning [53.42244686183879]
コンフォーマル予測は、モデルに依存しない、分布のない不確実性定量化を提供する。
しかし、敵が訓練データと校正データを操作した場合の毒殺攻撃では、共形予測は信頼性が低い。
信頼性予測セット (RPS): 汚染下での信頼性保証を証明可能な共形予測セットを構築するための最初の効率的な方法を提案する。
論文 参考訳(メタデータ) (2024-10-13T15:37:11Z) - Confidence and Dispersity Speak: Characterising Prediction Matrix for
Unsupervised Accuracy Estimation [51.809741427975105]
この研究は、ラベルを使わずに、分散シフト下でのモデルの性能を評価することを目的としている。
我々は、両方の特性を特徴付けるのに有効であることが示されている核規範を用いる。
核の基準は既存の手法よりも正確で堅牢であることを示す。
論文 参考訳(メタデータ) (2023-02-02T13:30:48Z) - Prediction-Powered Inference [68.97619568620709]
予測を用いた推論は、実験データセットに機械学習システムからの予測を補足した場合に有効な統計的推論を行うためのフレームワークである。
このフレームワークは、手段、量子、線形およびロジスティック回帰係数などの量に対して証明可能な信頼区間を計算するための単純なアルゴリズムを生成する。
予測による推論により、研究者は機械学習を使用して、より有効な、よりデータ効率の高い結論を導き出すことができる。
論文 参考訳(メタデータ) (2023-01-23T18:59:28Z) - Robust Validation: Confident Predictions Even When Distributions Shift [19.327409270934474]
本稿では,モデルが点予測ではなく,その予測に対して不確実な推定を行うような,頑健な予測推論の手順について述べる。
本稿では, トレーニング集団の周囲に$f$-divergence のボールを用いて, 任意のテスト分布に対して適切なカバレッジレベルを与える予測セットを生成する手法を提案する。
私たちの方法論の重要な構成要素は、将来のデータシフトの量を見積り、それに対する堅牢性を構築することです。
論文 参考訳(メタデータ) (2020-08-10T17:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。