論文の概要: Accelerated and interpretable oblique random survival forests
- arxiv url: http://arxiv.org/abs/2208.01129v1
- Date: Mon, 1 Aug 2022 20:21:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:31:37.893063
- Title: Accelerated and interpretable oblique random survival forests
- Title(参考訳): 加速・解釈可能な斜めランダムサバイバル森林
- Authors: Byron C. Jaeger, Sawyer Welden, Kristin Lenoir, Jaime L. Speiser,
Matthew Segar, Ambarish Pandey, Nicholas M. Pajewski
- Abstract要約: 斜めランダムサバイバル・フォレスト (RSF) は, アンサンブルが監督する学習手法である。
本研究では,斜めRCFの計算効率を向上させる手法と,個々の予測変数の重要性を推定する手法を提案する。
斜めRCFの実装は、斜めRCFの既存のソフトウェアと比較して、同等の差別と優れたブライアスコアで約450倍高速である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The oblique random survival forest (RSF) is an ensemble supervised learning
method for right-censored outcomes. Trees in the oblique RSF are grown using
linear combinations of predictors to create branches, whereas in the standard
RSF, a single predictor is used. Oblique RSF ensembles often have higher
prediction accuracy than standard RSF ensembles. However, assessing all
possible linear combinations of predictors induces significant computational
overhead that limits applications to large-scale data sets. In addition, few
methods have been developed for interpretation of oblique RSF ensembles, and
they remain more difficult to interpret compared to their axis-based
counterparts. We introduce a method to increase computational efficiency of the
oblique RSF and a method to estimate importance of individual predictor
variables with the oblique RSF. Our strategy to reduce computational overhead
makes use of Newton-Raphson scoring, a classical optimization technique that we
apply to the Cox partial likelihood function within each non-leaf node of
decision trees. We estimate the importance of individual predictors for the
oblique RSF by negating each coefficient used for the given predictor in linear
combinations, and then computing the reduction in out-of-bag accuracy. In
general benchmarking experiments, we find that our implementation of the
oblique RSF is approximately 450 times faster with equivalent discrimination
and superior Brier score compared to existing software for oblique RSFs. We
find in simulation studies that 'negation importance' discriminates between
relevant and irrelevant predictors more reliably than permutation importance,
Shapley additive explanations, and a previously introduced technique to measure
variable importance with oblique RSFs based on analysis of variance. Methods
introduced in the current study are available in the aorsf R package.
- Abstract(参考訳): 斜めランダムサバイバル・フォレスト (RSF) は, アンサンブルが監督する学習手法である。
斜めRCFのツリーは分岐を生成するために予測器の線形結合を用いて成長するが、標準RCFでは1つの予測器が使用される。
斜めRCFアンサンブルは標準RCFアンサンブルよりも高い予測精度を持つことが多い。
しかし、予測器の線形結合可能な全ての組み合わせを評価することは、大規模データセットに限定する計算オーバーヘッドを著しく引き起こす。
加えて、斜めrsfアンサンブルの解釈法が開発されているものはほとんどなく、軸ベースのアンサンブルに比べて解釈が困難である。
本研究では,斜め RSF の計算効率を向上させる手法と,斜め RSF を用いた個別予測変数の重要性を推定する方法を提案する。
決定木の各非リーフノード内のcox部分度関数に適用する古典的な最適化手法であるnewton-raphson scoreを用いて,計算オーバーヘッドを削減する。
与えられた予測器に使用する係数を線形結合で否定し、バッグ外精度の低減を計算することにより、斜めrsfに対する個々の予測器の重要性を推定する。
一般的なベンチマーク実験では, 斜めrsfの実装は, 既存の斜めrsfのソフトウェアと比較して, 同等の識別と高いブライアスコアで約450倍高速であることが判明した。
シミュレーション研究において,「否定的重要性」は置換的重要性よりも関連性のある予測因子と無関係な予測因子を確実に識別すること,シェープリー加法的説明,および分散分析に基づく斜めRCFを用いた変数重要度測定手法が導入された。
現在の研究で導入された手法は、Aorsf Rパッケージで利用可能である。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Iterative Methods for Full-Scale Gaussian Process Approximations for Large Spatial Data [9.913418444556486]
本稿では, FSAを用いた確率, 勾配, 予測分布の計算コストの削減に, 反復法をどのように利用できるかを示す。
また,推定法や反復法に依存する予測分散を計算する新しい,正確かつ高速な手法を提案する。
すべてのメソッドは、ハイレベルなPythonとRパッケージを備えたフリーのC++ソフトウェアライブラリで実装されている。
論文 参考訳(メタデータ) (2024-05-23T12:25:22Z) - Semi-Supervised Deep Sobolev Regression: Estimation, Variable Selection
and Beyond [3.782392436834913]
本研究では,半教師付き深部ソボレフ回帰器であるSDOREを提案し,基礎となる回帰関数とその勾配を非パラメトリックに推定する。
我々は、SDOREの収束率を総合的に分析し、回帰関数の最小値の最適値を確立する。
また、重要なドメインシフトが存在する場合でも、関連するプラグイン勾配推定器の収束率を導出する。
論文 参考訳(メタデータ) (2024-01-09T13:10:30Z) - Orthogonal Series Estimation for the Ratio of Conditional Expectation
Functions [2.855485723554975]
本章は、条件付き期待関数(CEFR)の推定と推定のための一般的な枠組みを開発する。
本研究は,ガウスブートストラップの有効性を含むCEFRの推定と推定のためのポイントワイドおよび均一な結果を導出する。
提案手法を適用し,世帯資産に対する401(k)プログラムの因果効果を推定する。
論文 参考訳(メタデータ) (2022-12-26T13:01:17Z) - Compound Batch Normalization for Long-tailed Image Classification [77.42829178064807]
本稿では,ガウス混合に基づく複合バッチ正規化法を提案する。
機能空間をより包括的にモデル化し、ヘッドクラスの優位性を減らすことができる。
提案手法は,画像分類における既存の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-02T07:31:39Z) - Sparse high-dimensional linear regression with a partitioned empirical
Bayes ECM algorithm [62.997667081978825]
疎高次元線形回帰に対する計算効率が高く強力なベイズ的手法を提案する。
パラメータに関する最小の事前仮定は、プラグイン経験的ベイズ推定(英語版)を用いて用いられる。
提案手法はRパッケージプローブに実装されている。
論文 参考訳(メタデータ) (2022-09-16T19:15:50Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Learning to Estimate Without Bias [57.82628598276623]
ガウスの定理は、重み付き最小二乗推定器は線形モデルにおける線形最小分散アンバイアスド推定(MVUE)であると述べている。
本稿では、バイアス制約のあるディープラーニングを用いて、この結果を非線形設定に拡張する第一歩を踏み出す。
BCEの第二の動機は、同じ未知の複数の推定値が平均化されてパフォーマンスが向上するアプリケーションにおいてである。
論文 参考訳(メタデータ) (2021-10-24T10:23:51Z) - Cluster Regularization via a Hierarchical Feature Regression [0.0]
本稿では,階層的特徴回帰(HFR)という新しいクラスタベース正規化を提案する。
機械学習とグラフ理論の領域からの洞察を動員し、予測セットの教師付き階層表現に沿ってパラメータを推定する。
経済成長予測への応用は、実証的な環境でのHFRの有効性を示すために用いられる。
論文 参考訳(メタデータ) (2021-07-10T13:03:01Z) - Learning Rates as a Function of Batch Size: A Random Matrix Theory
Approach to Neural Network Training [2.9649783577150837]
スパイクされたフィールド依存ランダム行列理論を用いて, ニューラルネットの損失景観に及ぼすミニバッチの影響について検討した。
我々は、スムーズで非ニュートンディープニューラルネットワークのための最大降下および適応訓練規則の解析式を導出する。
VGG/ResNetおよびImageNetデータセットのクレームを検証する。
論文 参考訳(メタデータ) (2020-06-16T11:55:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。