論文の概要: Group Shapley with Robust Significance Testing and Its Application to Bond Recovery Rate Prediction
- arxiv url: http://arxiv.org/abs/2501.03041v1
- Date: Mon, 06 Jan 2025 14:27:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:09:09.214335
- Title: Group Shapley with Robust Significance Testing and Its Application to Bond Recovery Rate Prediction
- Title(参考訳): ロバストな重要度試験をもつグループシェアリーとその債券回収率予測への応用
- Authors: Jingyi Wang, Ying Chen, Paolo Giudici,
- Abstract要約: Group Shapleyは、機能グループの重要性を評価するために、古典的な個別レベルのShapleyバリューフレームワークを拡張するメトリクスである。
本研究では,3つの累積カイ二乗近似に基づく有意な試験手法を開発し,その特性を検証した。
- 参考スコア(独自算出の注目度): 5.88968756842275
- License:
- Abstract: We propose Group Shapley, a metric that extends the classical individual-level Shapley value framework to evaluate the importance of feature groups, addressing the structured nature of predictors commonly found in business and economic data. More importantly, we develop a significance testing procedure based on a three-cumulant chi-square approximation and establish the asymptotic properties of the test statistics for Group Shapley values. Our approach can effectively handle challenging scenarios, including sparse or skewed distributions and small sample sizes, outperforming alternative tests such as the Wald test. Simulations confirm that the proposed test maintains robust empirical size and demonstrates enhanced power under diverse conditions. To illustrate the method's practical relevance in advancing Explainable AI, we apply our framework to bond recovery rate predictions using a global dataset (1996-2023) comprising 2,094 observations and 98 features, grouped into 16 subgroups and five broader categories: bond characteristics, firm fundamentals, industry-specific factors, market-related variables, and macroeconomic indicators. Our results identify the market-related variables group as the most influential. Furthermore, Lorenz curves and Gini indices reveal that Group Shapley assigns feature importance more equitably compared to individual Shapley values.
- Abstract(参考訳): 特徴群の重要性を評価するために,古典的個別レベルシェープ価値フレームワークを拡張した指標であるグループシェープリーを提案し,ビジネスや経済データによく見られる予測器の構造的性質に対処する。
さらに,3つの累積カイ二乗近似に基づく有意なテスト手法を開発し,グループシェープ値に対するテスト統計の漸近特性を確立する。
提案手法は,スパース分布やスキュード分布,サンプルサイズなどの難解なシナリオを効果的に処理し,Waldテストのような代替テストよりも優れている。
シミュレーションにより、提案試験は堅牢な実験サイズを維持し、多様な条件下での強化力を示す。
説明可能なAIの進展における手法の実践的妥当性を説明するため,本手法の枠組みをグローバルデータセット(1996-2023)を用いて,16のサブグループと5つのより広いカテゴリ(ボンド特性,堅固な基礎,業界固有の要因,市場関連変数,マクロ経済指標)に分類した2,094の観測と98の特徴を含む結合回復率予測に適用した。
本研究は,市場関連変数群を最も影響力のある変数群として同定した。
さらに、ローレンツ曲線とジーニ指標は、群シェープリーが個々のシェープリー値よりも同値に特徴的重要性を割り当てていることを明らかにする。
関連論文リスト
- GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - An Operational Perspective to Fairness Interventions: Where and How to
Intervene [9.833760837977222]
フェアネス介入の評価と文脈化のための包括的枠組みを提案する。
予測パリティに関するケーススタディで、我々のフレームワークを実証する。
グループデータを使わずに予測パリティを実現することは困難である。
論文 参考訳(メタデータ) (2023-02-03T07:04:33Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Cluster Regularization via a Hierarchical Feature Regression [0.0]
本稿では,階層的特徴回帰(HFR)という新しいクラスタベース正規化を提案する。
機械学習とグラフ理論の領域からの洞察を動員し、予測セットの教師付き階層表現に沿ってパラメータを推定する。
経済成長予測への応用は、実証的な環境でのHFRの有効性を示すために用いられる。
論文 参考訳(メタデータ) (2021-07-10T13:03:01Z) - Explaining a Series of Models by Propagating Local Feature Attributions [9.66840768820136]
複数の機械学習モデルを含むパイプラインは、多くの領域でパフォーマンスが向上するが、理解が難しい。
Shapley値への接続に基づいて、モデルの複雑なパイプラインを通じてローカル機能属性を伝播させるフレームワークを紹介します。
本フレームワークにより,アルツハイマー病および乳癌の組織学的診断における遺伝子発現特徴群に基づく高次結論の導出が可能となった。
論文 参考訳(メタデータ) (2021-04-30T22:20:58Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Robust Grouped Variable Selection Using Distributionally Robust
Optimization [11.383869751239166]
摂動下での群付き変数選択のための不確実性セットを用いた分布ロバスト最適化(DRO)の定式化を提案する。
我々は,サンプル外損失と推定バイアスの確率的境界を証明し,推定器の群化効果を確立する。
我々の定式化は,群レベルでの空間性を促進する解釈可能で同相なモデルを生成することを示す。
論文 参考訳(メタデータ) (2020-06-10T22:32:52Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。