論文の概要: FasterRisk: Fast and Accurate Interpretable Risk Scores
- arxiv url: http://arxiv.org/abs/2210.05846v1
- Date: Wed, 12 Oct 2022 00:36:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 15:14:22.909715
- Title: FasterRisk: Fast and Accurate Interpretable Risk Scores
- Title(参考訳): fastrisk: 迅速かつ正確な解釈可能なリスクスコア
- Authors: Jiachang Liu, Chudi Zhong, Boxuan Li, Margo Seltzer, Cynthia Rudin
- Abstract要約: リスクスコアは整数係数を持つ疎線形モデルである。
最近の研究では数理プログラミングが使われており、計算が遅くなっている。
データから得られた高品質なリスクスコアのコレクションを効率的に作成するためのアプローチを導入する。
- 参考スコア(独自算出の注目度): 17.015744876065195
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Over the last century, risk scores have been the most popular form of
predictive model used in healthcare and criminal justice. Risk scores are
sparse linear models with integer coefficients; often these models can be
memorized or placed on an index card. Typically, risk scores have been created
either without data or by rounding logistic regression coefficients, but these
methods do not reliably produce high-quality risk scores. Recent work used
mathematical programming, which is computationally slow. We introduce an
approach for efficiently producing a collection of high-quality risk scores
learned from data. Specifically, our approach produces a pool of almost-optimal
sparse continuous solutions, each with a different support set, using a
beam-search algorithm. Each of these continuous solutions is transformed into a
separate risk score through a "star ray" search, where a range of multipliers
are considered before rounding the coefficients sequentially to maintain low
logistic loss. Our algorithm returns all of these high-quality risk scores for
the user to consider. This method completes within minutes and can be valuable
in a broad variety of applications.
- Abstract(参考訳): 前世紀を通じて、リスクスコアは医療や刑事司法において最も一般的な予測モデルであった。
リスクスコアは整数係数を持つ疎線形モデルであり、しばしばこれらのモデルを記憶またはインデックスカードに配置することができる。
通常、リスクスコアはデータなしでもロジスティック回帰係数を丸めることで作成されているが、これらの方法は確実に高品質のリスクスコアを生成するものではない。
最近の研究は数理プログラミングを用いており、計算が遅い。
データから得られた高品質なリスクスコアのコレクションを効率的に作成するためのアプローチを導入する。
具体的には、ビーム探索アルゴリズムを用いて、それぞれ異なるサポートセットを持つほぼ最適スパース連続解のプールを生成する。
これらの連続解はそれぞれ「スターレイ」探索によって別のリスクスコアに変換され、そこでは係数を逐次丸め、ロジスティック損失を低く抑えるために様々な乗算器が検討される。
我々のアルゴリズムは、ユーザが考慮すべきすべての高品質のリスクスコアを返します。
この方法は数分で完成し、様々な応用に有用である。
関連論文リスト
- SOREL: A Stochastic Algorithm for Spectral Risks Minimization [1.6574413179773761]
スペクトルリスクは機械学習、特に現実世界の意思決定において幅広い応用がある。
異なるサンプルポイントの損失に異なる重みを割り当てることで、平均的なパフォーマンスと最悪のパフォーマンスの間にモデルのパフォーマンスを配置することができる。
SORELはスペクトルリスク最小化のための収束保証をもつ最初の勾配に基づくアルゴリズムである。
論文 参考訳(メタデータ) (2024-07-19T18:20:53Z) - Deep Ensembles Meets Quantile Regression: Uncertainty-aware Imputation for Time Series [45.76310830281876]
量子回帰に基づくタスクネットワークのアンサンブルを用いて不確実性を推定する新しい手法であるQuantile Sub-Ensemblesを提案する。
提案手法は,高い損失率に頑健な高精度な計算法を生成するだけでなく,非生成モデルの高速な学習により,計算効率も向上する。
論文 参考訳(メタデータ) (2023-12-03T05:52:30Z) - Best Subset Selection in Reduced Rank Regression [1.4699455652461724]
提案アルゴリズムは,有意な確率でランク推定を行うことができることを示す。
がん研究における数値的研究と応用は、有効性と拡張性を示している。
論文 参考訳(メタデータ) (2022-11-29T02:51:15Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - Minimax rate of consistency for linear models with missing values [0.0]
多くの実世界のデータセットでは、複数のソースが集約され、本質的に欠落した情報(センサーの故障、調査における未回答の疑問...)が欠落する。
本稿では,広範に研究された線形モデルに焦点をあてるが,不足する値が存在する場合には,非常に難しい課題であることが判明した。
最終的には、多くの学習タスクを解決し、入力機能の数を指数関数的にすることで、現在の現実世界のデータセットでは予測が不可能になる。
論文 参考訳(メタデータ) (2022-02-03T08:45:34Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Efficient First-Order Contextual Bandits: Prediction, Allocation, and
Triangular Discrimination [82.52105963476703]
統計的学習、オンライン学習、その他における繰り返しのテーマは、低騒音の問題に対してより速い収束率が可能であることである。
1次保証は統計的およびオンライン学習において比較的よく理解されている。
三角識別と呼ばれる対数損失と情報理論量が一階保証を得る上で基本的な役割を担っていることを示す。
論文 参考訳(メタデータ) (2021-07-05T19:20:34Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Run2Survive: A Decision-theoretic Approach to Algorithm Selection based
on Survival Analysis [75.64261155172856]
生存分析(SA)は、自然に検閲されたデータをサポートし、アルゴリズムランタイムの分散モデルを学習するためにそのようなデータを使用する適切な方法を提供する。
我々は、アルゴリズム選択に対する洗練された決定論的アプローチの基礎として、そのようなモデルを活用し、Run2Surviveを疑う。
標準ベンチマークASlibによる広範な実験では、我々のアプローチは競争力が高く、多くの場合、最先端のASアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-07-06T15:20:17Z) - Fast Risk Assessment for Autonomous Vehicles Using Learned Models of
Agent Futures [10.358493658420173]
本稿では,自動走行車における軌道のリスクを評価するために,高速な非サンプリング方式を提案する。
提案手法はガウス混合モデルと非ガウス混合モデルの両方を含む不確実な予測に対する幅広い表現に対処する。
提案手法は、ArgoverseデータセットとCARLAデータセットでトレーニングされたプロパゲートからの現実的な予測に基づいて実証される。
論文 参考訳(メタデータ) (2020-05-27T16:16:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。