論文の概要: ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk
- arxiv url: http://arxiv.org/abs/2603.06671v1
- Date: Tue, 03 Mar 2026 04:41:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:12.702458
- Title: ERP-RiskBench: Leakage-Safe Ensemble Learning for Financial Risk
- Title(参考訳): ERP-RiskBench:財務リスクに対する漏洩防止学習
- Authors: Sanjay Mishra,
- Abstract要約: 本稿では、アンサンブル機械学習を用いたERP財務リスク検出のための再構成実験フレームワークを提案する。
リスク定義はハイブリッドで、調達のコンプライアンス異常と取引詐欺の両方をカバーする。
ERP-RiskBenchと呼ばれる複合ベンチマークは、公開調達イベントログ、ラベル付き不正データ、新しい合成ERPデータセットから組み立てられる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Financial risk detection in Enterprise Resource Planning (ERP) systems is an important but underexplored application of machine learning. Published studies in this area tend to suffer from vague dataset descriptions, leakage-prone pipelines, and evaluation practices that inflate reported performance. This paper presents a rebuilt experimental framework for ERP financial risk detection using ensemble machine learning. The risk definition is hybrid, covering both procurement compliance anomalies and transactional fraud. A composite benchmark called ERP-RiskBench is assembled from public procurement event logs, labeled fraud data, and a new synthetic ERP dataset with rule-injected risk typologies and conditional tabular GAN augmentation. Nested cross-validation with time-aware and group-aware splitting enforces leakage prevention throughout the pipeline. The primary model is a stacking ensemble of gradient boosting methods, tested alongside linear baselines, deep tabular architectures, and an interpretable glassbox alternative. Performance is measured through Matthews Correlation Coefficient, area under the precision-recall curve, and cost-sensitive decision analysis using calibrated probabilities. Across multiple dataset configurations and a structured ablation study, the stacking ensemble achieves the best detection results. Leakage-safe protocols reduce previously inflated accuracy estimates by a notable margin. SHAP-based explanations and feature stability analysis show that procurement control features, especially three-way matching discrepancies, rank as the most informative predictors. The resulting framework provides a reproducible, operationally grounded blueprint for machine learning deployment in ERP audit and governance settings.
- Abstract(参考訳): 企業資源計画(ERP)システムにおける金融リスク検出は、機械学習の重要かつ未調査の応用である。
この領域で公表された研究は、あいまいなデータセット記述、漏れやすいパイプライン、および報告されたパフォーマンスに影響を及ぼす評価プラクティスに悩まされる傾向にある。
本稿では、アンサンブル機械学習を用いたERP財務リスク検出のための再構成実験フレームワークを提案する。
リスク定義はハイブリッドで、調達のコンプライアンス異常と取引詐欺の両方をカバーする。
ERP-RiskBenchと呼ばれる複合ベンチマークは、公開調達イベントログ、ラベル付き不正データ、ルール注入型リスクタイプポロジーと条件付きタブ状GAN拡張を備えた新しい合成ERPデータセットから組み立てられる。
タイムアウェアとグループアウェアの分割によるネストされたクロスバリデーションは、パイプライン全体のリーク防止を強制する。
第一のモデルは、線形ベースライン、深い表層構造、解釈可能なガラス箱の代替品と共にテストされる勾配促進手法の積み重ねアンサンブルである。
マシューズ相関係数, 高精度リコール曲線下領域, およびキャリブレーションされた確率を用いたコスト感受性決定分析により, 性能を計測した。
複数のデータセットの構成と構造化されたアブレーション研究を通して、積み重ねアンサンブルは最高の検出結果を得る。
漏洩安全プロトコルは、予め膨らませた精度を顕著なマージンで低減する。
SHAPに基づく説明と特徴安定性解析は、調達制御の特徴、特に三方向整合の相違を最も有意義な予測因子としてランク付けしていることを示している。
結果として得られるフレームワークは、ERP監査とガバナンス設定における機械学習デプロイメントのための再現可能な、運用上の基盤となる青写真を提供する。
関連論文リスト
- Safer Reasoning Traces: Measuring and Mitigating Chain-of-Thought Leakage in LLMs [5.834576254792341]
CoT(Chain-of-Thought)プロンプトは、個人識別可能な情報(PII)をプロンプトから推論トレースと出力に変換することで、プライバシーリスクを増大させる。
モデルに依存しないフレームワークを用いて, 直接的, 推論時のPIIリークについて検討する。
論文 参考訳(メタデータ) (2026-03-05T19:20:44Z) - Refining Decision Boundaries In Anomaly Detection Using Similarity Search Within the Feature Space [3.3202103799131795]
SDA2E(Sparse Dual Adversarial Attention-based AutoEncoder)を導入する。
本稿では,意思決定境界を効率的に洗練するための3つの新しい戦略を統合した類似性誘導型アクティブラーニングフレームワークを提案する。
SDA2Eは、複数のDARPAトランスペアレントコンピューティングシナリオを含む52の不均衡データセットにわたって広範囲に評価し、15の最先端の異常検出手法と比較した。
論文 参考訳(メタデータ) (2026-02-02T23:55:08Z) - Consolidation or Adaptation? PRISM: Disentangling SFT and RL Data via Gradient Concentration [56.074760766965085]
PRISMは、モデルの既存の知識との認知的対立度に基づいてデータを調停する動的認識フレームワークを実現する。
この結果から,内部最適化方式に基づくデータ分離が,スケーラブルでロバストなエージェントアライメントに不可欠であることが示唆された。
論文 参考訳(メタデータ) (2026-01-12T05:43:20Z) - Reliable LLM-Based Edge-Cloud-Expert Cascades for Telecom Knowledge Systems [54.916243942641444]
大規模言語モデル(LLM)は、通信などの分野において、自動化の鍵となる存在として浮上している。
本研究では,問合せパイプラインによる意思決定を支援する,エッジクラウドに精通したLLMベースの知識システムについて検討する。
論文 参考訳(メタデータ) (2025-12-23T03:10:09Z) - LLM-Generated Counterfactual Stress Scenarios for Portfolio Risk Simulation via Hybrid Prompt-RAG Pipeline [0.0]
マクロ財務ストレステストのための透明で完全に監査可能なLCMベースのパイプラインを開発した。
このシステムは、GDPの成長、インフレ、政策金利をカバーするG7のための機械可読マクロ経済シナリオを生成する。
モデル、国、検索設定を越えて、LLMはコヒーレントで国固有のストレス物語を生成する。
論文 参考訳(メタデータ) (2025-11-26T19:29:22Z) - Relational Deep Dive: Error-Aware Queries Over Unstructured Data [9.0236658372663]
ReDD(Relational Deep Dive)は、クエリ固有のスキーマを動的に発見し、リレーショナルテーブルをポップアップさせ、証明可能な保証でエラー認識抽出を保証するフレームワークである。
主な貢献は、カバレッジ保証付きエラー検出の統計的校正手法であるSCAPEと、精度と人的補正コストのトレードオフを最適化するハイブリッドアプローチであるSCAPE-HYBである。
論文 参考訳(メタデータ) (2025-11-04T16:30:55Z) - Revisiting Multivariate Time Series Forecasting with Missing Values [65.30332997607141]
現実の時系列では欠落値が一般的である。
現在のアプローチでは、計算モジュールを使用して、不足した値を補う、計算済みの予測フレームワークが開発されている。
このフレームワークは、致命的な問題を見落としている: 欠落した値に対して基礎的な真理は存在せず、予測精度を劣化させる可能性のあるエラーの影響を受けやすいようにしている。
本稿では,Information Bottleneck原則に基づく新しいフレームワークであるConsistency-Regularized Information Bottleneck(CRIB)を紹介する。
論文 参考訳(メタデータ) (2025-09-27T20:57:48Z) - Distributionally Robust Optimization with Adversarial Data Contamination [49.89480853499918]
凸リプシッツ損失関数を持つ一般化線形モデルに対するワッサーシュタイン-1 DRO 目標の最適化に焦点をあてる。
私たちの主な貢献は、データ汚染のトレーニングに対するロバストネスと分散シフトに対するロバストネスを統合した、新しいモデリングフレームワークです。
この研究は、データ汚染と分散シフトという2つの課題の下で学習するために、効率的な計算によって支援される最初の厳密な保証を確立する。
論文 参考訳(メタデータ) (2025-07-14T18:34:10Z) - Stress-Testing ML Pipelines with Adversarial Data Corruption [11.91482648083998]
規制当局は現在、ハイテイクシステムは現実的で相互依存的なエラーに耐えられるという証拠を要求している。
SAVAGEは依存性グラフとフレキシブルな汚いテンプレートを通じて、データ品質の問題を正式にモデル化するフレームワークです。
Savanageは、脆弱性のあるデータサブポピュレーションと微調整による汚職の深刻度を効率的に識別するために、双方向の最適化アプローチを採用している。
論文 参考訳(メタデータ) (2025-06-02T00:41:24Z) - Evaluating probabilistic classifiers: Reliability diagrams and score
decompositions revisited [68.8204255655161]
確率的に統計的に一貫性があり、最適に結合し、再現可能な信頼性図を自動生成するCORP手法を導入する。
コーパスは非パラメトリックアイソトニック回帰に基づいており、プール・アジャセント・ヴァイオレータ(PAV)アルゴリズムによって実装されている。
論文 参考訳(メタデータ) (2020-08-07T08:22:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。