論文の概要: Comparative Evaluation of Machine Learning Approaches for Minority-Class Financial Distress Prediction Under Class Imbalance Constraints
- arxiv url: http://arxiv.org/abs/2605.14067v1
- Date: Wed, 13 May 2026 19:44:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.483509
- Title: Comparative Evaluation of Machine Learning Approaches for Minority-Class Financial Distress Prediction Under Class Imbalance Constraints
- Title(参考訳): クラス不均衡制約下におけるマイノリティクラス財務距離予測のための機械学習手法の比較評価
- Authors: Karan Sehgal, Khawar Naveed Bhatti,
- Abstract要約: 本稿では,古典的統計手法,アンサンブル学習手法,探索的ニューラルモデルの比較評価を行った。
本研究は、厳密なクラス不均衡制約下での財政的危機予測のための再現性と解釈可能な機械学習を支援するための応用工学評価として位置づけられている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Financial distress prediction remains a significant challenge in enterprise risk analysis due to the highly imbalanced nature of real-world financial datasets, where bankrupt or distressed firms typically constitute only a small minority of observations. This paper presents a comparative evaluation of classical statistical methods, ensemble learning approaches, and exploratory neural models for minority-class financial distress prediction under class imbalance constraints. The study incorporates structured preprocessing, imbalance mitigation using the Synthetic Minority Oversampling Technique (SMOTE), comparative evaluation across ensemble learning architectures including XGBoost, CatBoost, LightGBM, Random Forest, and explainability analysis using SHAP-based feature attribution methods. Experimental evaluation demonstrates that gradient-boosting approaches achieved improved minority-class sensitivity relative to baseline statistical classifiers under severe imbalance conditions. The workflow additionally emphasises reproducibility, interpretability, auditability, and governance-oriented machine learning evaluation within enterprise financial risk environments. The work is positioned as an applied engineering evaluation intended to support reproducible and interpretable machine learning workflows for financial distress prediction under severe class imbalance constraints.
- Abstract(参考訳): 金融危機予測は、実際の金融データセットの高度に不均衡な性質のため、企業リスク分析において重要な課題であり続けている。
本稿では,古典的統計手法,アンサンブル学習手法,探索的ニューラルモデルの比較評価を行った。
本研究は、構造化前処理、SMOTE(Synthetic Minority Oversampling Technique)を用いた不均衡緩和、XGBoost、CatBoost、LightGBM、Random Forestなどのアンサンブル学習アーキテクチャの比較評価、SHAPに基づく特徴属性法による説明可能性分析を含む。
実験により,高度不均衡条件下での基線統計分類器に対して,勾配ブースト法によりマイノリティクラス感度が向上したことが示された。
このワークフローは、企業金融リスク環境における再現性、解釈可能性、監査可能性、ガバナンス指向の機械学習評価にも重点を置いている。
この研究は、厳密なクラス不均衡の制約の下での財政的危機予測のために、再現性と解釈可能な機械学習ワークフローをサポートするための応用工学評価として位置づけられている。
関連論文リスト
- Conditional Adversarial Fragility in Financial Machine Learning under Macroeconomic Stress [0.0]
逆境の脆弱性は、逆境の脆弱性がマクロ経済的なストレスの期間に体系的に増幅される規則に依存する現象である。
我々は、金融機械学習における敵意の堅牢性は、体制に依存した資産であり、リスク評価を高リスクでモデル化するためのストレス対応アプローチを動機付けていることを示す。
論文 参考訳(メタデータ) (2025-12-22T23:44:39Z) - Comparative Evaluation of Embedding Representations for Financial News Sentiment Analysis [0.0]
本研究は,資源制約環境における財務ニュース感情分類のための埋め込み型手法の比較評価を行う。
強力なバリデーションメトリクスにもかかわらず、自明なベースラインよりもパフォーマンスの悪いモデル。
発見は、埋め込み品質だけで感情分類における基本的なデータ不足に対処できないという実証的な証拠を提供する。
論文 参考訳(メタデータ) (2025-12-15T04:52:30Z) - Technical Report: Facilitating the Adoption of Causal Inference Methods Through LLM-Empowered Co-Pilot [44.336297829718795]
CATE-Bは,大規模言語モデル(LLM)をエージェントフレームワーク内で使用して,治療効果推定を通じてユーザを誘導する,オープンソースのコパイロットシステムである。
CATE-B は (i) 因果発見と LLM に基づくエッジオリエンテーションによる構造因果モデルの構築、 (ii) 因果構造とデータセット特性に適合した適切な回帰方法を選択することによるロバストな調整セットの同定を支援する。
論文 参考訳(メタデータ) (2025-08-14T12:20:51Z) - A Structured Reasoning Framework for Unbalanced Data Classification Using Probabilistic Models [1.6951945839990796]
本稿では,不均衡データに対するマルコフネットワークモデルについて検討し,分類バイアスとマイノリティクラス認識能力不足の問題を解くことを目的とした。
実験の結果,マルコフネットワークは重み付け精度,F1スコア,AUC-ROCなどの指標で良好に動作することがわかった。
将来の研究は、大規模不均衡なデータ環境における効率的なモデルトレーニング、構造最適化、ディープラーニングの統合に焦点を当てることができる。
論文 参考訳(メタデータ) (2025-02-05T17:20:47Z) - Ultra-imbalanced classification guided by statistical information [24.969543903532664]
我々は,エンフルトラ不均衡分類(UIC)と呼ばれる新しい定式化を提案することによって,不均衡学習に対する集団レベルのアプローチをとる。
UICでは、無限のトレーニングサンプルが利用可能であっても、損失関数は異なる振る舞いをする。
UIC下でのデータ不均衡に対して確実に抵抗できる新しい学習目標であるTunable Boosting Lossを開発した。
論文 参考訳(メタデータ) (2024-09-06T08:07:09Z) - Learning Confidence Bounds for Classification with Imbalanced Data [42.40303003632808]
本稿では,学習理論と集中不等式を利用して従来のソリューションの欠点を克服する新しい枠組みを提案する。
本手法は, クラスごとに異なる不均衡度に効果的に適応できるため, より堅牢で信頼性の高い分類結果が得られる。
論文 参考訳(メタデータ) (2024-07-16T16:02:27Z) - Weak Supervision Performance Evaluation via Partial Identification [46.73061437177238]
Programmatic Weak Supervision (PWS) は、地上の真理ラベルに直接アクセスすることなく、教師付きモデルトレーニングを可能にする。
本稿では,モデル評価を部分的同定問題としてフレーミングすることで,この問題に対処する新しい手法を提案する。
提案手法は,従来の弱監督評価手法において,ラベル付きデータを必要とせず,重要な指標に信頼性のあるバウンダリを導出する。
論文 参考訳(メタデータ) (2023-12-07T07:15:11Z) - On the Robustness of Random Forest Against Untargeted Data Poisoning: An
Ensemble-Based Approach [42.81632484264218]
機械学習モデルでは、トレーニングセット(中毒)の分画の摂動が、モデルの精度を著しく損なう可能性がある。
本研究の目的は、ランダムな森林を標的のない無作為な毒殺攻撃から保護する、新しいハッシュベースのアンサンブルアプローチを実現することである。
論文 参考訳(メタデータ) (2022-09-28T11:41:38Z) - Bayesian Bilinear Neural Network for Predicting the Mid-price Dynamics
in Limit-Order Book Markets [84.90242084523565]
伝統的な時系列計量法は、価格力学を駆動する多層相互作用の真の複雑さを捉えることができないことが多い。
最先端の2次最適化アルゴリズムを採用することで、時間的注意を払ってベイジアン双線形ニューラルネットワークを訓練する。
予測分布を用いて推定パラメータとモデル予測に関連する誤差や不確実性を解析することにより、ベイズモデルと従来のML代替品を徹底的に比較する。
論文 参考訳(メタデータ) (2022-03-07T18:59:54Z) - Fairness and Robustness in Invariant Learning: A Case Study in Toxicity
Classification [13.456851070400024]
不変リスク最小化(Invariant Risk Minimization、IRM)は、因果発見にインスパイアされた手法を用いて、堅牢な予測子を見つけるドメイン一般化アルゴリズムである。
IRMは経験的リスク最小化法(ERM)よりも分布外精度と公平性を向上できることを示す。
論文 参考訳(メタデータ) (2020-11-12T16:42:14Z) - Counterfactual Representation Learning with Balancing Weights [74.67296491574318]
観察データによる因果推論の鍵は、それぞれの治療タイプに関連する予測的特徴のバランスを達成することである。
近年の文献では、この目標を達成するために表現学習を探求している。
因果効果を柔軟かつスケーラブルかつ正確に推定するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-10-23T19:06:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。