論文の概要: Building Conformal Prediction Intervals with Approximate Message Passing
- arxiv url: http://arxiv.org/abs/2410.16493v1
- Date: Mon, 21 Oct 2024 20:34:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:29:42.669626
- Title: Building Conformal Prediction Intervals with Approximate Message Passing
- Title(参考訳): 近似メッセージパッシングによる等角予測区間の構築
- Authors: Lucas Clarté, Lenka Zdeborová,
- Abstract要約: 等角予測は、分布のない方法で有効な予測間隔を構築するための強力なツールである。
本稿では,予測間隔の計算を高速化するために,AMP(Adroximate Message Passing)に基づく新しいアルゴリズムを提案する。
提案手法では,基準値に近い予測間隔が生成され,精度は桁違いに向上した。
- 参考スコア(独自算出の注目度): 14.951392270119461
- License:
- Abstract: Conformal prediction has emerged as a powerful tool for building prediction intervals that are valid in a distribution-free way. However, its evaluation may be computationally costly, especially in the high-dimensional setting where the dimensionality and sample sizes are both large and of comparable magnitudes. To address this challenge in the context of generalized linear regression, we propose a novel algorithm based on Approximate Message Passing (AMP) to accelerate the computation of prediction intervals using full conformal prediction, by approximating the computation of conformity scores. Our work bridges a gap between modern uncertainty quantification techniques and tools for high-dimensional problems involving the AMP algorithm. We evaluate our method on both synthetic and real data, and show that it produces prediction intervals that are close to the baseline methods, while being orders of magnitude faster. Additionally, in the high-dimensional limit and under assumptions on the data distribution, the conformity scores computed by AMP converge to the one computed exactly, which allows theoretical study and benchmarking of conformal methods in high dimensions.
- Abstract(参考訳): 分布のない方法で有効な予測区間を構築するための強力なツールとして,コンフォーマル予測が登場した。
しかし、その評価は、特に寸法とサンプルサイズが大小かつ同等の大きさの高次元設定において、計算的にコストがかかる可能性がある。
一般化線形回帰の文脈でこの問題に対処するために,完全共形予測を用いて予測区間の計算を高速化する,近似メッセージパッシング(AMP)に基づく新しいアルゴリズムを提案する。
我々の研究は、AMPアルゴリズムを含む高次元問題に対する現代の不確実性定量化技術とツールのギャップを埋めるものである。
提案手法を合成データと実データの両方で評価し,基準値に近い予測間隔を生成できることを示す。
さらに、高次元の極限とデータ分布の仮定の下で、AMPによって計算された整合性スコアは正確に計算されたものと収束し、高次元における整合性メソッドの理論的研究とベンチマークを可能にする。
関連論文リスト
- On Statistical Rates and Provably Efficient Criteria of Latent Diffusion Transformers (DiTs) [12.810268045479992]
本研究では,DiTsスコア関数の普遍近似とサンプル複雑性について検討した。
我々は、潜伏型DiTが初期データの高次元性に関わる課題を回避できる可能性を示している。
論文 参考訳(メタデータ) (2024-07-01T08:34:40Z) - Distributed Markov Chain Monte Carlo Sampling based on the Alternating
Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。
我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。
シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文 参考訳(メタデータ) (2024-01-29T02:08:40Z) - Scalable computation of prediction intervals for neural networks via
matrix sketching [79.44177623781043]
既存の不確実性推定アルゴリズムでは、モデルアーキテクチャとトレーニング手順を変更する必要がある。
本研究では、与えられたトレーニングされたニューラルネットワークに適用し、近似予測間隔を生成できる新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-06T13:18:31Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - An AI-Assisted Design Method for Topology Optimization Without
Pre-Optimized Training Data [68.8204255655161]
トポロジ最適化に基づくAI支援設計手法を提示し、最適化された設計を直接的に得ることができる。
設計は、境界条件と入力データとしての充填度に基づいて、人工ニューラルネットワーク、予測器によって提供される。
論文 参考訳(メタデータ) (2020-12-11T14:33:27Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Conformal prediction for time series [16.38369532102931]
textttEnbPIは、共形予測(CP)と密接に関連しているが、データ交換性を必要としないアンサンブル予測をラップする。
提案手法の有効性を実証するため,広範囲なシミュレーションと実データ解析を行った。
論文 参考訳(メタデータ) (2020-10-18T21:05:32Z) - Frequency Estimation in Data Streams: Learning the Optimal Hashing
Scheme [3.7565501074323224]
本稿では,最適化と機械学習に基づくデータストリームの周波数推定問題に対する新しいアプローチを提案する。
提案手法は、観測されたストリームプレフィックスをほぼ最適にハッシュ要素に利用し、ターゲット周波数分布を圧縮する。
提案手法は, 推定誤差の平均(要素単位)と推定誤差の平均(要素単位)で1~2桁, 予測誤差で45~90%の精度で既存手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-07-17T22:15:22Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - Estimating Basis Functions in Massive Fields under the Spatial Mixed
Effects Model [8.528384027684194]
大規模データセットでは、予測最大化(EM)アルゴリズムを用いた定位クリグが、通常の計算で禁止されるクリグ法に代わるものとして提案されている。
本研究では,空間混合効果(SME)モデルを用いた代替手法を開発したが,観測値と結び目の間の空間依存性の範囲をAECMアルゴリズムを用いて推定することで,さらなる柔軟性を実現することができる。
実験により,予測精度を犠牲にすることなく,余剰パラメータ推定の計算負担を最小化しながら,予測精度の向上を図っている。
論文 参考訳(メタデータ) (2020-03-12T19:36:40Z) - Scalable Distributed Approximation of Internal Measures for Clustering
Evaluation [5.144809478361603]
クラスタリング評価のための内部測度はシルエット係数であり、計算には2つの距離計算が必要である。
本稿では,任意の距離に基づいてクラスタリングの評価を行うための厳密な近似を計算した最初のスケーラブルアルゴリズムを提案する。
また,このアルゴリズムは凝集や分離などのクラスタリング品質の他の内部指標の厳密な近似に適応可能であることも証明した。
論文 参考訳(メタデータ) (2020-03-03T10:28:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。