論文の概要: How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features
- arxiv url: http://arxiv.org/abs/2603.05317v1
- Date: Thu, 05 Mar 2026 15:58:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.309766
- Title: How important are the genes to explain the outcome - the asymmetric Shapley value as an honest importance metric for high-dimensional features
- Title(参考訳): 結果を説明する遺伝子の重要性 - 高次元特徴に対する真に重要な指標としての非対称シェープリー値-
- Authors: Mark A. van de Wiel, Jeroen Goedhart, Martin Jullum, Kjersti Aas,
- Abstract要約: 臨床予測設定では、ゲノム学のような高次元の特徴の重要性は予測性能の変化を評価することによって評価されることが多い。
混合次元予測モデルの文脈における特徴重要度を定量化するために,非対称シェープ値を用いる方法を提案する。
- 参考スコア(独自算出の注目度): 1.0499611180329804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In clinical prediction settings the importance of a high-dimensional feature like genomics is often assessed by evaluating the change in predictive performance when adding it to a set of traditional clinical variables. This approach is questionable, because it does not account for collinearity nor known directionality of dependencies between variables. We suggest to use asymmetric Shapley values as a more suitable alternative to quantify feature importance in the context of a mixed-dimensional prediction model. We focus on a setting that is particularly relevant in clinical prediction: disease state as a mediating variable for genomic effects, with additional confounders for which the direction of effects may be unknown. We derive efficient algorithms to compute local and global asymmetric Shapley values for this setting. The former are shown to be very useful for inference, whereas the latter provide interpretation by decomposing any predictive performance metric into contributions of the features. Throughout, we illustrate our framework by a leading example: the prediction of progression-free survival for colorectal cancer patients.
- Abstract(参考訳): 臨床予測設定では、ゲノム学のような高次元の特徴の重要性は、従来の臨床変数のセットに加える際の予測性能の変化を評価することによって評価されることが多い。
このアプローチは、変数間の依存関係のコリニアリティや既知の方向性を考慮しないため、疑問の余地がある。
混合次元予測モデルの文脈における特徴重要度を定量化するために,非対称シェープリー値を用いる方法を提案する。
臨床予測に特に関係のある設定に焦点をあてる: 疾患状態はゲノム効果の媒介変数であり, 効果の方向性が不明な共同創設者も加わった。
この設定に対して局所的および大域的非対称なシェープリー値を計算する効率的なアルゴリズムを導出する。
前者は推論に非常に有用であることが示され、後者は予測性能指標を特徴の寄与に分解して解釈する。
本研究は,大腸癌患者に対する無再発生存の予測を主例として,本フレームワークを概説する。
関連論文リスト
- Semiparametric conformal prediction [79.6147286161434]
ベクトル値の非整合性スコアの結合相関構造を考慮した共形予測セットを構築する。
スコアの累積分布関数(CDF)を柔軟に推定する。
提案手法は,現実の回帰問題に対して,所望のカバレッジと競争効率をもたらす。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - On the Effects of Irrelevant Variables in Treatment Effect Estimation with Deep Disentanglement [0.0]
医療、教育、経済学において、観察データから治療効果を推定することが最重要である。
選択バイアスに対処する現在の深い絡み合いに基づく手法は、無関係な変数を扱うのに不十分である。
我々は, 深層埋込法で前処理変数をアンタングルし, 無関係変数を明示的に識別し, 表現する。
論文 参考訳(メタデータ) (2024-07-29T13:34:34Z) - Challenges in Variable Importance Ranking Under Correlation [6.718144470265263]
本稿では,特徴相関が変数重要度評価に与える影響を総合シミュレーションで検討する。
ノックオフ変数と対応する予測変数の間には相関関係は常に存在しないが、相関関係が予測変数間の特定の相関しきい値を超えて線形に増加することを証明している。
論文 参考訳(メタデータ) (2024-02-05T19:02:13Z) - Quantifying predictive uncertainty of aphasia severity in stroke patients with sparse heteroscedastic Bayesian high-dimensional regression [47.1405366895538]
高次元データに対する疎線型回帰法は、通常、残留物が一定の分散を持つと仮定するが、これは実際には破ることができる。
本稿では,ヘテロセダスティック分割経験的ベイズ期待条件最大化アルゴリズムを用いて,高次元ヘテロセダスティック線形回帰モデルを推定する。
論文 参考訳(メタデータ) (2023-09-15T22:06:29Z) - Monotonicity and Double Descent in Uncertainty Estimation with Gaussian
Processes [52.92110730286403]
限界確率はクロスバリデーションの指標を思い起こさせるべきであり、どちらもより大きな入力次元で劣化すべきである、と一般的に信じられている。
我々は,ハイパーパラメータをチューニングすることにより,入力次元と単調に改善できることを証明した。
また、クロスバリデーションの指標は、二重降下の特徴である質的に異なる挙動を示すことも証明した。
論文 参考訳(メタデータ) (2022-10-14T08:09:33Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - TACTiS: Transformer-Attentional Copulas for Time Series [76.71406465526454]
時間変化量の推定は、医療や金融などの分野における意思決定の基本的な構成要素である。
本稿では,アテンションベースデコーダを用いて関節分布を推定する多元的手法を提案する。
本研究では,本モデルが実世界の複数のデータセットに対して最先端の予測を生成することを示す。
論文 参考訳(メタデータ) (2022-02-07T21:37:29Z) - Decorrelated Variable Importance [0.0]
LOCOの修正版を定義し,相関効果を緩和する手法を提案する。
このパラメータは非パラメトリック推定が難しいが,半パラメトリックモデルを用いて推定する方法を示す。
論文 参考訳(メタデータ) (2021-11-21T16:31:36Z) - When in Doubt: Neural Non-Parametric Uncertainty Quantification for
Epidemic Forecasting [70.54920804222031]
既存の予測モデルは不確実な定量化を無視し、誤校正予測をもたらす。
不確実性を考慮した時系列予測のためのディープニューラルネットワークの最近の研究にもいくつかの制限がある。
本稿では,予測タスクを確率的生成過程としてモデル化し,EPIFNPと呼ばれる機能的ニューラルプロセスモデルを提案する。
論文 参考訳(メタデータ) (2021-06-07T18:31:47Z) - Nonparametric Feature Impact and Importance [0.6123324869194193]
データ上で直接動作する部分依存曲線から導かれる特徴的影響と重要性の数学的定義を与える。
品質を評価するために、これらの定義によってランク付けされた特徴は、既存の特徴選択技術と競合することを示す。
論文 参考訳(メタデータ) (2020-06-08T17:07:35Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z) - A general framework for inference on algorithm-agnostic variable
importance [3.441021278275805]
本稿では,解釈可能なアルゴリズムに依存しない変数重要度に関する非推論のためのフレームワークを提案する。
本提案は,HIV-1感染に対する抗体調査から得られたデータを用いて,良好な手術特性を示す。
論文 参考訳(メタデータ) (2020-04-07T20:09:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。