論文の概要: coverforest: Conformal Predictions with Random Forest in Python
- arxiv url: http://arxiv.org/abs/2501.14570v1
- Date: Fri, 24 Jan 2025 15:24:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-27 14:57:41.045769
- Title: coverforest: Conformal Predictions with Random Forest in Python
- Title(参考訳): Coverforest: Pythonのランダムフォレストによるコンフォーマルな予測
- Authors: Panisara Meehinkong, Donlapark Ponnoprat,
- Abstract要約: CoverforestはPythonパッケージで、ランダムなフォレストに最適化された効率的なコンフォメーション予測メソッドを実装している。
本実験は,森林の予測が望まれる範囲に到達できることを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Conformal prediction provides a framework for uncertainty quantification, specifically in the forms of prediction intervals and sets with distribution-free guaranteed coverage. While recent cross-conformal techniques such as CV+ and Jackknife+-after-bootstrap achieve better data efficiency than traditional split conformal methods, they incur substantial computational costs due to required pairwise comparisons between training and test samples' out-of-bag scores. Observing that these methods naturally extend from ensemble models, particularly random forests, we leverage existing optimized random forest implementations to enable efficient cross-conformal predictions. We present coverforest, a Python package that implements efficient conformal prediction methods specifically optimized for random forests. coverforest supports both regression and classification tasks through various conformal prediction methods, including split conformal, CV+, Jackknife+-after-bootstrap, and adaptive prediction sets. Our package leverages parallel computing and Cython optimizations to speed up out-of-bag calculations. Our experiments demonstrate that coverforest's predictions achieve the desired level of coverage. In addition, its training and prediction times can be faster than an existing implementation by 2--9 times. The source code for the coverforest is hosted on GitHub at https://github.com/donlapark/coverforest.
- Abstract(参考訳): コンフォーマル予測は、不確実な定量化のための枠組み、特に予測間隔の形式と、分布のない保証されたカバレッジを持つ集合を提供する。
近年のCV+やJackknife+-after-bootstrapのようなクロスコンフォーマルな手法は、従来の分割型コンフォーマル手法よりも優れたデータ効率を実現する一方で、トレーニングとテストサンプルのアウト・オブ・バグスコアのペア比較を必要とするため、かなりの計算コストがかかる。
これらの手法が自然にアンサンブルモデル、特にランダムな森林から拡張されることを観察し、既存の最適化されたランダムな森林実装を活用し、効率的なクロスコンフォーマルな予測を可能にする。
ランダムフォレストに特化して最適化された効率的な共形予測手法を実装したPythonパッケージであるCoverforestを提案する。
カバーフォレストは、スプリットコンフォメーション、CV+、Jackknife+-after-bootstrap、適応予測セットなど、様々なコンフォメーション予測手法を通じて回帰タスクと分類タスクの両方をサポートする。
我々のパッケージは並列計算とCython最適化を利用して、バグ計算を高速化する。
本実験は,森林の予測が望まれる範囲に到達できることを実証した。
さらに、トレーニングと予測時間は既存の実装よりも2~9倍速くなります。
カバーフォレストのソースコードはGitHubでhttps://github.com/donlapark/coverforest.comで公開されている。
関連論文リスト
- Multi-model Ensemble Conformal Prediction in Dynamic Environments [14.188004615463742]
本稿では,複数の候補モデルから予測セットを作成するために使用されるモデルを選択する適応型共形予測フレームワークを提案する。
提案アルゴリズムは, 有効なカバレッジを維持しつつ, 全区間にわたる強い適応的後悔を達成できることが証明された。
論文 参考訳(メタデータ) (2024-11-06T05:57:28Z) - Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Treeffuser: Probabilistic Predictions via Conditional Diffusions with Gradient-Boosted Trees [39.9546129327526]
Treeffuserは、表データの確率的予測のための使いやすい方法である。
Treeffuserはよく校正された予測分布を学習し、幅広い回帰タスクを処理できる。
Walmartの営業データを用いて、不確実性の下での在庫配分への応用について、その汎用性を実証する。
論文 参考訳(メタデータ) (2024-06-11T18:59:24Z) - Regression Trees for Fast and Adaptive Prediction Intervals [2.6763498831034043]
本稿では,局所的なカバレッジ保証を伴う回帰問題に対して,予測間隔を調整するための一連の手法を提案する。
回帰木とランダムフォレストを適合度スコアでトレーニングすることで分割を作成する。
提案手法は多種多様な適合性スコアや予測設定に適用できるため,多種多様である。
論文 参考訳(メタデータ) (2024-02-12T01:17:09Z) - FABind: Fast and Accurate Protein-Ligand Binding [127.7790493202716]
$mathbfFABind$はポケット予測とドッキングを組み合わせたエンドツーエンドモデルで、正確で高速なタンパク質-リガンド結合を実現する。
提案モデルでは,既存手法と比較して有効性と効率性に強い利点が示される。
論文 参考訳(メタデータ) (2023-10-10T16:39:47Z) - Efficient and Differentiable Conformal Prediction with General Function
Classes [96.74055810115456]
本稿では,複数の学習可能なパラメータに対する共形予測の一般化を提案する。
本研究は, クラス内において, ほぼ有効な人口被覆率, ほぼ最適効率を実現していることを示す。
実験の結果,提案アルゴリズムは有効な予測セットを学習し,効率を著しく向上できることがわかった。
論文 参考訳(メタデータ) (2022-02-22T18:37:23Z) - RFpredInterval: An R Package for Prediction Intervals with Random
Forests and Boosted Forests [0.0]
我々は、ランダムな森林や森林の増生を伴う予測区間を構築するために、16の手法を統合した包括的RパッケージRFpredIntervalを開発した。
このパッケージに実装された手法は,Roy と Larocque (2020) が提案したランダムな森林で予測間隔を生成するために,PRBFと15の異なる変種で予測間隔を構築する新しい方法である。
その結果,提案手法は競争力が高く,世界規模では競合手法よりも優れていた。
論文 参考訳(メタデータ) (2021-06-15T15:27:50Z) - Predict then Interpolate: A Simple Algorithm to Learn Stable Classifiers [59.06169363181417]
Predict then Interpolate (PI) は環境全体にわたって安定な相関関係を学習するためのアルゴリズムである。
正しい予測と間違った予測の分布を補間することにより、不安定な相関が消えるオラクル分布を明らかにすることができる。
論文 参考訳(メタデータ) (2021-05-26T15:37:48Z) - Stochastic Optimization Forests [60.523606291705214]
標準的なランダムな森林アルゴリズムのように予測精度を向上させるために分割するのではなく、分割を選択した木を栽培し、下流の意思決定品質を直接最適化することで、森林決定政策の訓練方法を示す。
概略分割基準は、各候補分割に対して正確に最適化された森林アルゴリズムに近い性能を保ちながら、100倍のランニング時間を短縮できることを示す。
論文 参考訳(メタデータ) (2020-08-17T16:56:06Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。