論文の概要: Regression Conformal Prediction under Bias
- arxiv url: http://arxiv.org/abs/2410.05263v1
- Date: Mon, 7 Oct 2024 17:59:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-01 19:57:23.970047
- Title: Regression Conformal Prediction under Bias
- Title(参考訳): バイアス下における回帰コンフォーマル予測
- Authors: Matt Y. Cheung, Tucker J. Netherton, Laurence E. Court, Ashok Veeraraghavan, Guha Balakrishnan,
- Abstract要約: コンフォーマル予測(CP)は、有効なカバレッジで予測間隔を生成する。
本研究では,CP間隔がバイアスの影響について検討する。
私たちの研究は、よりバイアスのかかる機械学習システムへの道を開くものです。
- 参考スコア(独自算出の注目度): 17.252204163950964
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncertainty quantification is crucial to account for the imperfect predictions of machine learning algorithms for high-impact applications. Conformal prediction (CP) is a powerful framework for uncertainty quantification that generates calibrated prediction intervals with valid coverage. In this work, we study how CP intervals are affected by bias - the systematic deviation of a prediction from ground truth values - a phenomenon prevalent in many real-world applications. We investigate the influence of bias on interval lengths of two different types of adjustments -- symmetric adjustments, the conventional method where both sides of the interval are adjusted equally, and asymmetric adjustments, a more flexible method where the interval can be adjusted unequally in positive or negative directions. We present theoretical and empirical analyses characterizing how symmetric and asymmetric adjustments impact the "tightness" of CP intervals for regression tasks. Specifically for absolute residual and quantile-based non-conformity scores, we prove: 1) the upper bound of symmetrically adjusted interval lengths increases by $2|b|$ where $b$ is a globally applied scalar value representing bias, 2) asymmetrically adjusted interval lengths are not affected by bias, and 3) conditions when asymmetrically adjusted interval lengths are guaranteed to be smaller than symmetric ones. Our analyses suggest that even if predictions exhibit significant drift from ground truth values, asymmetrically adjusted intervals are still able to maintain the same tightness and validity of intervals as if the drift had never happened, while symmetric ones significantly inflate the lengths. We demonstrate our theoretical results with two real-world prediction tasks: sparse-view computed tomography (CT) reconstruction and time-series weather forecasting. Our work paves the way for more bias-robust machine learning systems.
- Abstract(参考訳): 不確かさの定量化は、高インパクトアプリケーションのための機械学習アルゴリズムの不完全な予測を考慮に入れるために不可欠である。
コンフォーマル予測(CP)は、キャリブレーションされた予測間隔を有効なカバレッジで生成する不確実性定量化のための強力なフレームワークである。
本研究では,CP間隔が,実世界の多くの応用でよく見られる現象である偏差(基底真理値からの予測の体系的偏差)の影響について検討する。
本研究では,2種類の調整の間隔長に対するバイアスの影響について検討する。対称的調整,区間の両辺を等しく調整する従来の方法,非対称的調整,すなわち区間を正あるいは負の方向に不等に調整するより柔軟な方法である。
回帰タスクにおけるCP間隔の「高さ」に対称的・非対称的な調整がどう影響するかを理論的・経験的分析により明らかにした。
具体的には、絶対残差および量子的非整合性スコアについて、次のように証明する。
1) 対称的に調整された間隔長の上界は2|b|$で増加し、b$はバイアスを表す世界的なスカラー値である。
2)非対称に調整された間隔の長さはバイアスの影響を受けず、
3)非対称的に調整された間隔長が対称長よりも小さいことが保証された場合。
解析の結果, 予測値が地中真理値から有意なドリフトを示したとしても, 非対称的に調整された間隔は, ドリフトが起こらなかったような時間間隔の厳密さと有効性を維持することができる一方で, 対称的間隔は長さを著しく増大させることがわかった。
我々は,2つの実世界の予測タスク,スパース・ビュー・コンピュート・トモグラフィー(CT)再構成と時系列天気予報の理論的結果を実証した。
私たちの研究は、よりバイアスのかかる機械学習システムへの道を開くものです。
関連論文リスト
- Multivariate root-n-consistent smoothing parameter free matching estimators and estimators of inverse density weighted expectations [51.000851088730684]
我々は、パラメトリックな$sqrt n $-rateで収束する、最も近い隣人の新しい修正とマッチング推定器を開発する。
我々は,非パラメトリック関数推定器は含まないこと,特に標本サイズ依存パラメータの平滑化には依存していないことを強調する。
論文 参考訳(メタデータ) (2024-07-11T13:28:34Z) - Enhancing reliability in prediction intervals using point forecasters: Heteroscedastic Quantile Regression and Width-Adaptive Conformal Inference [0.0]
一組のインターバルを評価する際には、従来の対策だけでは不十分である、と我々は主張する。
間隔は長さによって変化しなければならないが、この変化は予測の難しさに直接関係している。
本稿では,HQRモデルとWidth-Adaptive Conformal Inference(WACI)手法を提案する。
論文 参考訳(メタデータ) (2024-06-21T06:51:13Z) - Normalizing Flows for Conformal Regression [0.0]
Conformal Prediction (CP)アルゴリズムは、ラベル付きデータに基づいて出力を校正することで予測モデルの不確実性を推定する。
キャリブレーション過程をトレーニングすることで、間隔をローカライズする一般的なスキームを提案する。
PapadopoulosらによるError Reweighting CPアルゴリズム(2008年)とは異なり、このフレームワークは名目と経験的条件の妥当性のギャップを推定できる。
論文 参考訳(メタデータ) (2024-06-05T15:04:28Z) - Relaxed Quantile Regression: Prediction Intervals for Asymmetric Noise [51.87307904567702]
量子レグレッション(Quantile regression)は、出力の分布における量子の実験的推定を通じてそのような間隔を得るための主要なアプローチである。
本稿では、この任意の制約を除去する量子回帰に基づく区間構成の直接的な代替として、Relaxed Quantile Regression (RQR)を提案する。
これにより、柔軟性が向上し、望ましい品質が向上することが実証された。
論文 参考訳(メタデータ) (2024-06-05T13:36:38Z) - Beyond Calibration: Assessing the Probabilistic Fit of Neural Regressors via Conditional Congruence [2.2359781747539396]
ディープネットワークは、しばしば過剰な自信と不一致な予測分布に悩まされる。
本稿では,条件付きカーネルの平均埋め込みを用いて,学習した予測分布とデータセットにおける経験的条件分布との距離を推定する,条件付きコングルーエンス誤差(CCE)について紹介する。
本研究では,1)データ生成プロセスが知られている場合の分布間の不一致を正確に定量化し,2)実世界の高次元画像回帰タスクに効果的にスケールし,3)未知のインスタンス上でのモデルの信頼性を評価することができることを示す。
論文 参考訳(メタデータ) (2024-05-20T23:30:07Z) - A U-turn on Double Descent: Rethinking Parameter Counting in Statistical
Learning [68.76846801719095]
二重降下がいつどこで起こるのかを正確に示し、その位置が本質的に閾値 p=n に結び付けられていないことを示す。
これは二重降下と統計的直観の間の緊張を解消する。
論文 参考訳(メタデータ) (2023-10-29T12:05:39Z) - Conditional validity of heteroskedastic conformal regression [12.905195278168506]
等角予測と分割等角予測は、統計的保証付き予測間隔を推定するための分布自由なアプローチを提供する。
近年の研究では、分割共形予測は、限界被覆に着目した場合、最先端の予測間隔を生み出すことが示されている。
本稿では,正規化やモンドリアン等式予測などの手法を用いて,予測間隔の構築方法について,新たな光を当てることを試みる。
論文 参考訳(メタデータ) (2023-09-15T11:10:46Z) - Modeling the space-time correlation of pulsed twin beams [68.8204255655161]
パラメトリックダウンコンバージョンによって生成される絡み合ったツインビームは、画像指向アプリケーションで好まれるソースである。
本研究では,時間消費数値シミュレーションと非現実的な平面波ポンプ理論のギャップを埋めることを目的とした半解析モデルを提案する。
論文 参考訳(メタデータ) (2023-01-18T11:29:49Z) - Monotonicity and Double Descent in Uncertainty Estimation with Gaussian
Processes [52.92110730286403]
限界確率はクロスバリデーションの指標を思い起こさせるべきであり、どちらもより大きな入力次元で劣化すべきである、と一般的に信じられている。
我々は,ハイパーパラメータをチューニングすることにより,入力次元と単調に改善できることを証明した。
また、クロスバリデーションの指標は、二重降下の特徴である質的に異なる挙動を示すことも証明した。
論文 参考訳(メタデータ) (2022-10-14T08:09:33Z) - Breaking Symmetries of the Reservoir Equations in Echo State Networks [0.0]
最も一般的なセットアップは有害な対称性を持ち、ミラー・トラクターと呼ばれるものを予測することに繋がる。
同様の問題が一般的な文脈で起こりうるので、いくつかの設計の成功や失敗を説明するためにそれらを使用します。
論文 参考訳(メタデータ) (2020-09-21T16:00:22Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。