論文の概要: PINE: Pruning Boosted Tree Ensembles with Conformal In-Distribution Prediction Equivalence
- arxiv url: http://arxiv.org/abs/2605.28068v1
- Date: Wed, 27 May 2026 07:25:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.840878
- Title: PINE: Pruning Boosted Tree Ensembles with Conformal In-Distribution Prediction Equivalence
- Title(参考訳): PINE: Conformal In-Distribution Prediction Equivalence を用いた植林木組立
- Authors: Haruki Yajima, Yusuke Matsui,
- Abstract要約: ツリーアンサンブルは、予測性能と解釈可能性の強い機械学習モデルである。
本研究では,分散領域内での強い保証を提供するプルーニング手法であるPINEを提案する。
PINEは圧縮率を最大30%改善し、既存の忠実なプルーニング手法と同等のレベルで予測を保存する。
- 参考スコア(独自算出の注目度): 18.24617806469662
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tree ensembles are machine learning models with strong predictive performance and interpretability, and remain widely used for tabular data. Standard pruning methods for tree ensembles typically optimize an accuracy-compression trade-off and may change a subset of predictions, potentially compromising decision consistency. Faithful pruning methods address this issue by preserving prediction equivalence over the entire input space, but this requirement leads to lower compression ratios. We propose PINE, a pruning method that provides strong guarantees within an in-distribution region. PINE preserves prediction equivalence within this region and controls the region size using a single parameter $α$ via conformal calibration. Experiments on 12 public tabular datasets show that PINE improves the compression ratio by up to $30\%$ while preserving predictions at a comparable level to existing faithful pruning methods.
- Abstract(参考訳): ツリーアンサンブルは、強力な予測性能と解釈可能性を持つ機械学習モデルであり、表データに広く使用されている。
ツリーアンサンブルの標準的なプルーニング手法は、通常、精度と圧縮のトレードオフを最適化し、予測のサブセットを変更し、決定の一貫性を損なう可能性がある。
忠実なプルーニング法は、入力空間全体の予測等価性を保ってこの問題に対処するが、この要求は圧縮比を低くする。
本研究では,分散領域内での強い保証を提供するプルーニング手法であるPINEを提案する。
PINEはこの領域内の予測等価性を保ち、共形キャリブレーションによる単一のパラメータ$α$を用いて領域サイズを制御する。
12の公開グラフデータセットの実験によると、PINEは圧縮率を最大30セントまで改善し、既存の忠実なプルーニング手法と同等のレベルで予測を保存する。
関連論文リスト
- Multi-Variable Conformal Prediction: Optimizing Prediction Sets without Data Splitting [16.714269073574428]
多変数共形予測(MCP)は,共形予測関数を複数の同時変数で拡張するフレームワークである。
我々は、RemMCPとRelMCPが、目標カバレッジセットサイズよりも小さいか同等の予測セットサイズで、常に目標カバレッジ問題に適合することを実証した。
論文 参考訳(メタデータ) (2026-05-12T16:19:51Z) - Partition Trees: Conditional Density Estimation over General Outcome Spaces [46.1988967916659]
一般結果空間上での条件密度推定のための木に基づくフレームワークである分割木を提案する。
本手法は,データ適応分割における条件分布を一括一貫した密度としてモデル化し,条件付き負の対数関係を直接最小化して木を学習する。
論文 参考訳(メタデータ) (2026-02-03T22:12:30Z) - ST-BCP: Tightening Coverage Bound for Backward Conformal Prediction via Non-Conformity Score Transformation [18.272247805086284]
コンフォーマル予測(CP)は、カバレッジ保証付き予測セットを構成する不確実性定量化のための統計フレームワークを提供する。
BCPはこのパラダイムを逆転させ、セットサイズに事前定義された上限を強制し、その結果のカバレッジ保証を推定する。
本稿では,非整合性スコアのデータ依存変換を導入し,カバレッジギャップを狭める新しい方法ST-BCPを紹介する。
論文 参考訳(メタデータ) (2026-02-02T07:18:35Z) - Uncertainty-Aware Extrapolation in Bayesian Oblique Trees [0.8602553195689513]
適度に一貫性のある葉の予測は、トレーニング対象によって境界付けられ、しばしば分布シフトの下で過信される。
本稿では,各葉にGP予測器を装着することにより,VSPYCTを拡張した単木ベイズモデルを提案する。
論文 参考訳(メタデータ) (2026-01-30T12:19:17Z) - Distribution-informed Online Conformal Prediction [53.674678995825666]
更新ルールに基礎となるデータパターンを組み込んだオンラインコンフォメーション予測アルゴリズムである Conformal Optimistic Prediction (COP) を提案する。
COPは予測可能なパターンが存在する場合により厳密な予測セットを生成し、見積もりが不正確な場合でも有効なカバレッジ保証を保持する。
我々は,COPが有効なカバレッジを実現し,他のベースラインよりも短い予測間隔を構築できることを証明した。
論文 参考訳(メタデータ) (2025-12-08T17:51:49Z) - E-Values Expand the Scope of Conformal Prediction [49.1574468325115]
コンフォーマル予測は、分布のない不確実性定量化のための強力なフレームワークである。
本稿では,共形e-predictionと呼ばれる電子値に基づく代替手法について検討する。
E値は、p値では達成できない重要な利点を提供し、新しい理論的および実用的能力を実現する。
論文 参考訳(メタデータ) (2025-03-17T10:54:30Z) - Building Trees for Probabilistic Prediction via Scoring Rules [0.0]
非パラメトリックな予測分布を生成するために木を修正することを研究する。
木を構築するための標準的な手法は、良い予測分布にはならないかもしれない。
我々は,適切なスコアリングルールに基づいて,木の分割基準を1つに変更することを提案する。
論文 参考訳(メタデータ) (2024-02-16T20:04:13Z) - Probabilistic Gradient Boosting Machines for Large-Scale Probabilistic
Regression [51.770998056563094]
PGBM(Probabilistic Gradient Boosting Machines)は、確率的予測を生成する手法である。
既存の最先端手法と比較してPGBMの利点を実証的に示す。
論文 参考訳(メタデータ) (2021-06-03T08:32:13Z) - Private Prediction Sets [72.75711776601973]
機械学習システムは、個人のプライバシーの確実な定量化と保護を必要とする。
これら2つのデシラタを共同で扱う枠組みを提案する。
本手法を大規模コンピュータビジョンデータセット上で評価する。
論文 参考訳(メタデータ) (2021-02-11T18:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。