論文の概要: Gradient Boosted Risk Scores
- arxiv url: http://arxiv.org/abs/2605.02593v1
- Date: Mon, 04 May 2026 13:44:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.310522
- Title: Gradient Boosted Risk Scores
- Title(参考訳): グラディエントな上昇リスクスコア
- Authors: Costa Georgantas, Jonas Richiardi,
- Abstract要約: リスクスコアは、機械学習モデルの解釈可能で実行可能なクラスである。
本稿では,コンパクトで予測可能なリスクスコアを構築するための,シンプルで効果的なアプローチを提案する。
提案手法は,回帰に基づく代替よりもはるかにコンパクトなスコアを出力しながら,競争力のある予測性能を実現する。
- 参考スコア(独自算出の注目度): 0.45835414225547183
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Risk scores are an interpretable and actionable class of machine learning models with applications in medicine, insurance, and risk management. Unlike most computational methods, risk scores are designed to be computed by a human by attributing points to a data sample based on a limited set of criteria. The most common approaches for generating risk scores use linear regressions to estimate the effect of selected variables. We propose a simple and effective approach towards building compact and predictive risk scores. We provide an algorithm based on gradient boosting that is capable of modeling nonlinear effects, along with a C++ implementation with Python and R bindings. Through extensive empirical evaluation on twelve tabular datasets spanning regression, classification, and time-to-event tasks, we show that our method achieves competitive predictive performance while producing substantially more compact scores than regression-based alternatives, with 60% fewer rules for classification tasks and 16% fewer rules for time-to-event tasks on average, compared to AutoScore.
- Abstract(参考訳): リスクスコアは、医療、保険、リスク管理に応用された、解釈可能で実行可能な機械学習モデルのクラスである。
多くの計算方法とは異なり、リスクスコアは限られた基準に基づいてデータサンプルに点を割り当てることで人間によって計算されるように設計されている。
リスクスコアを生成する最も一般的なアプローチは、選択された変数の効果を推定するために線形回帰を用いる。
本稿では,コンパクトで予測可能なリスクスコアを構築するための,シンプルで効果的なアプローチを提案する。
非線形効果をモデル化可能な勾配ブースティングに基づくアルゴリズムと,PythonおよびRバインディングを用いたC++実装を提案する。
回帰, 分類, タイム・ツー・エグゼクティブタスクにまたがる12の表型データセットに対する広範な実験的な評価により, 提案手法は, 回帰に基づく代替よりもかなりコンパクトなスコアを出力し, 平均16%のタイム・ツー・エグゼクティブタスクのルールを平均16%減らし, 競合予測性能を達成することを示した。
関連論文リスト
- Learning from M-Tuple Dominant Positive and Unlabeled Data [9.568395664931504]
本稿では,実世界のアプリケーションシナリオに適合する汎用学習フレームワークであるemphMDPUを提案する。
経験的リスク最小化 (ERM) 法に基づいて, リスク一貫性を満足する未バイアスリスク推定器を導出する。
トレーニング中に必然的に過適合する問題を緩和するため、リスク補正手法を導入し、修正されたリスク推定器の開発に繋がる。
論文 参考訳(メタデータ) (2025-05-25T13:20:11Z) - Survival Models: Proper Scoring Rule and Stochastic Optimization with Competing Risks [6.9648613217501705]
SurvivalBoostは、4つの実生活データセットで12の最先端モデルを上回っている。
優れたキャリブレーション、任意の時間軸にわたって予測する機能、既存のメソッドよりも高速な計算時間を提供する。
論文 参考訳(メタデータ) (2024-10-22T07:33:34Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Safe Deployment for Counterfactual Learning to Rank with Exposure-Based
Risk Minimization [63.93275508300137]
本稿では,安全な配置を理論的に保証する新たなリスク認識型対実学習ランク法を提案する。
提案手法の有効性を実験的に検証し,データが少ない場合の動作不良の早期回避に有効であることを示す。
論文 参考訳(メタデータ) (2023-04-26T15:54:23Z) - FasterRisk: Fast and Accurate Interpretable Risk Scores [17.015744876065195]
リスクスコアは整数係数を持つ疎線形モデルである。
最近の研究では数理プログラミングが使われており、計算が遅くなっている。
データから得られた高品質なリスクスコアのコレクションを効率的に作成するためのアプローチを導入する。
論文 参考訳(メタデータ) (2022-10-12T00:36:01Z) - Continual Learning For On-Device Environmental Sound Classification [63.81276321857279]
デバイス上での環境音の分類のための簡易かつ効率的な連続学習法を提案する。
本手法は,サンプルごとの分類の不確実性を測定することにより,トレーニングの履歴データを選択する。
論文 参考訳(メタデータ) (2022-07-15T12:13:04Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Boosted CVaR Classification [44.731468512484824]
モデル尾部性能を最大化するための一般的なアプローチは、CVaR損失を最小限に抑えることである。
モデルがゼロ1損失によって評価される分類タスクの場合、平均ゼロ1損失の最小化はCVaRゼロ1損失を最小化する。
本稿では,CVaR と LPBoost という古典的ブースティングアルゴリズムとの直接的な関係を動機としたBoosted CVaR 分類フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-26T18:27:25Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。