論文の概要: XtracTree: a Simple and Effective Method for Regulator Validation of
Bagging Methods Used in Retail Banking
- arxiv url: http://arxiv.org/abs/2004.02326v3
- Date: Tue, 17 Aug 2021 14:31:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 12:00:35.420042
- Title: XtracTree: a Simple and Effective Method for Regulator Validation of
Bagging Methods Used in Retail Banking
- Title(参考訳): xtractree:リテールバンキングにおける袋詰方法の簡易かつ効果的な検証方法
- Authors: Jeremy Charlier and Vladimir Makarenkov
- Abstract要約: ランダムフォレストなどのMLバッグ分類器を簡単な「if-then」ルールに変換するアルゴリズムであるXtracTreeを提案する。
我々の実験は、XtracTreeを使うことで、MLモデルをルールベースのアルゴリズムに変換することができることを示した。
提案されたアプローチにより、銀行機関は、エンドユーザへのAIソリューションのデリバリ時間の最大50%を削減できるようになりました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bootstrap aggregation, known as bagging, is one of the most popular ensemble
methods used in machine learning (ML). An ensemble method is a ML method that
combines multiple hypotheses to form a single hypothesis used for prediction. A
bagging algorithm combines multiple classifiers modeled on different
sub-samples of the same data set to build one large classifier. Banks, and
their retail banking activities, are nowadays using the power of ML algorithms,
including decision trees and random forests, to optimize their processes.
However, banks have to comply with regulators and governance and, hence,
delivering effective ML solutions is a challenging task. It starts with the
bank's validation and governance department, followed by the deployment of the
solution in a production environment up to the external validation of the
national financial regulator. Each proposed ML model has to be validated and
clear rules for every algorithm-based decision must be justified. In this
context, we propose XtracTree, an algorithm capable of efficiently converting
an ML bagging classifier, such as a random forest, into simple "if-then" rules
satisfying the requirements of model validation. We use a public loan data set
from Kaggle to illustrate the usefulness of our approach. Our experiments
demonstrate that using XtracTree, one can convert an ML model into a rule-based
algorithm, leading to easier model validation by national financial regulators
and the bank's validation department. The proposed approach allowed our banking
institution to reduce up to 50% the time of delivery of our AI solutions to the
end-user.
- Abstract(参考訳): ブートストラップアグリゲーション(bootstrap aggregation)は、機械学習(ml)で使われる最も一般的なアンサンブル手法の1つである。
アンサンブル法は、複数の仮説を組み合わせるML法であり、予測に使用される単一の仮説を形成する。
バグングアルゴリズムは、同じデータセットの異なるサブサンプルに基づいてモデル化された複数の分類器を組み合わせて、1つの大きな分類器を構築する。
銀行とその小売銀行活動は、現在、意思決定木やランダムな森林を含むMLアルゴリズムの力を使ってプロセスの最適化を行っている。
しかし、銀行は規制やガバナンスに従わなければならないため、効果的なMLソリューションを提供することは難しい課題である。
銀行の検証とガバナンス部門から始まり、続いて生産環境にソリューションを配置し、国立金融規制当局の外部の検証まで実施する。
提案するmlモデルは検証され、アルゴリズムに基づく決定の明確なルールは正当化されなければならない。
本稿では,ランダムフォレストなどのMLバッグ分類器をモデル検証の要件を満たす単純な「if-then」ルールに変換するアルゴリズムであるXtracTreeを提案する。
私たちは、アプローチの有用性を説明するために、Kaggleの公開ローンデータセットを使用します。
我々の実験は、xtractreeを用いてmlモデルをルールベースのアルゴリズムに変換し、国立金融規制当局と銀行の検証部門によるモデルの検証を容易にすることを実証する。
提案されたアプローチにより、銀行機関は、エンドユーザへのAIソリューションのデリバリ時間の最大50%を削減できるようになりました。
関連論文リスト
- Generative Verifiers: Reward Modeling as Next-Token Prediction [29.543787728397643]
検証や報酬モデルはしばしば、大きな言語モデル(LLM)の推論性能を高めるために使われる。
本研究では,ユビキタスな次世代予測目標を用いて,検証とソリューション生成を併用したトレーニング検証手法を提案する。
GenRMは差別的, DPO 検証, LLM-as-a-Judge に優れていた。
論文 参考訳(メタデータ) (2024-08-27T17:57:45Z) - Comparing Hyper-optimized Machine Learning Models for Predicting Efficiency Degradation in Organic Solar Cells [39.847063110051245]
本研究は,有機太陽電池 (OSC) の電力変換効率 (PCE) に苦しむ時間的劣化を表現するための機械学習モデルを提案する。
製造プロセスと環境条件の両方に関して最大7変数を含む996項目のデータベースを180日間以上作成しました。
一方、根平均二乗誤差(RMSE)、二乗誤差(SSE)の和、および平均絶対誤差(MAE)>1%の目標値であるPCEは、係数決定(R2)の値に達した。
論文 参考訳(メタデータ) (2024-03-29T22:05:26Z) - Effective Neural Network $L_0$ Regularization With BinMask [15.639601066641099]
簡単な定式化である BinMask が有効$L_0$正則化であることを示す。
我々は,BinMaskを特徴選択,ネットワーク分割,モデル正規化の3つのタスクで評価する。
論文 参考訳(メタデータ) (2023-04-21T20:08:57Z) - Active Fairness Auditing [22.301071549943064]
本研究では,問合せに基づく監査アルゴリズムについて検討し,問合せ効率のよいMLモデルの妥当性を推定する。
本稿では,最適決定性アルゴリズムと,同等の保証を持つ実用的なランダム化・オラクル効率アルゴリズムを提案する。
アクティブフェアネス推定の最初の調査は、AIガバナンスをより堅固な理論基盤に置くことを目的としています。
論文 参考訳(メタデータ) (2022-06-16T21:12:00Z) - Unpacking the Black Box: Regulating Algorithmic Decisions [1.283555556182245]
本稿では,貸付,医療検査,雇用などの高額なアプリケーションで使用される「ブラックボックス」アルゴリズムの監視モデルを提案する。
複雑なアルゴリズムを許すことは、福祉を改善することができるが、その利益は規制当局の規制方法に依存する。
論文 参考訳(メタデータ) (2021-10-05T23:20:25Z) - Probabilistic Case-based Reasoning for Open-World Knowledge Graph
Completion [59.549664231655726]
ケースベース推論(CBR)システムは,与えられた問題に類似した事例を検索することで,新たな問題を解決する。
本稿では,知識ベース(KB)の推論において,そのようなシステムが実現可能であることを示す。
提案手法は,KB内の類似エンティティからの推論パスを収集することにより,エンティティの属性を予測する。
論文 参考訳(メタデータ) (2020-10-07T17:48:12Z) - Coded Stochastic ADMM for Decentralized Consensus Optimization with Edge
Computing [113.52575069030192]
セキュリティ要件の高いアプリケーションを含むビッグデータは、モバイルデバイスやドローン、車両など、複数の異種デバイスに収集され、格納されることが多い。
通信コストとセキュリティ要件の制限のため、核融合センターにデータを集約するのではなく、分散的に情報を抽出することが最重要となる。
分散エッジノードを介してデータを局所的に処理するマルチエージェントシステムにおいて,モデルパラメータを学習する問題を考える。
分散学習モデルを開発するために,乗算器アルゴリズムの最小バッチ交互方向法(ADMM)のクラスについて検討した。
論文 参考訳(メタデータ) (2020-10-02T10:41:59Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - Model-Based Multi-Agent RL in Zero-Sum Markov Games with Near-Optimal
Sample Complexity [67.02490430380415]
モデルに基づくMARLは、Nash平衡値(NE)を求めるために$tilde O(|S||B|(gamma)-3epsilon-2)$のサンプル複雑性を実現する。
また、アルゴリズムが報酬に依存しない場合、そのようなサンプル境界は最小値(対数因子まで)であり、アルゴリズムは報酬知識のない遷移サンプルを問合せする。
論文 参考訳(メタデータ) (2020-07-15T03:25:24Z) - Breaking the Sample Size Barrier in Model-Based Reinforcement Learning
with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。
最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。
対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文 参考訳(メタデータ) (2020-05-26T17:53:18Z) - ELECTRA: Pre-training Text Encoders as Discriminators Rather Than
Generators [108.3381301768299]
Masked Language Modeling (MLM) は、BERT のような事前学習手法で、いくつかのトークンを [MASK] に置き換えて、元のトークンを再構築するためにモデルをトレーニングすることで入力を破損させた。
代用トークン検出という,より効率的な事前学習タスクを提案する。
論文 参考訳(メタデータ) (2020-03-23T21:17:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。