論文の概要: The Most Important Features in Generalized Additive Models Might Be Groups of Features
- arxiv url: http://arxiv.org/abs/2506.19937v1
- Date: Tue, 24 Jun 2025 18:25:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 21:00:42.503464
- Title: The Most Important Features in Generalized Additive Models Might Be Groups of Features
- Title(参考訳): 一般化付加モデルにおける最も重要な特徴は特徴群かもしれない
- Authors: Tomas M. Bosschieter, Luis Franca, Jessica Wolk, Yiyuan Wu, Bella Mehta, Joseph Dehoney, Orsolya Kiss, Fiona C. Baker, Qingyu Zhao, Rich Caruana, Kilian M. Pohl,
- Abstract要約: 本稿では,GAM(Generalized Additive Models)における特徴群の重要性を判定するための新しいアプローチを提案する。
本稿では, 群重心の挙動を多種多様なデータ構造で示す3つの合成実験において, 提案手法の特性について述べる。
- 参考スコア(独自算出の注目度): 10.324544560083543
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While analyzing the importance of features has become ubiquitous in interpretable machine learning, the joint signal from a group of related features is sometimes overlooked or inadvertently excluded. Neglecting the joint signal could bypass a critical insight: in many instances, the most significant predictors are not isolated features, but rather the combined effect of groups of features. This can be especially problematic for datasets that contain natural groupings of features, including multimodal datasets. This paper introduces a novel approach to determine the importance of a group of features for Generalized Additive Models (GAMs) that is efficient, requires no model retraining, allows defining groups posthoc, permits overlapping groups, and remains meaningful in high-dimensional settings. Moreover, this definition offers a parallel with explained variation in statistics. We showcase properties of our method on three synthetic experiments that illustrate the behavior of group importance across various data regimes. We then demonstrate the importance of groups of features in identifying depressive symptoms from a multimodal neuroscience dataset, and study the importance of social determinants of health after total hip arthroplasty. These two case studies reveal that analyzing group importance offers a more accurate, holistic view of the medical issues compared to a single-feature analysis.
- Abstract(参考訳): 解釈可能な機械学習において、特徴の重要性を分析することは至るところで行われているが、関連する特徴群からのジョイントシグナルは見過ごされ、不注意に除外されることがある。
多くの場合、最も重要な予測器は孤立した特徴ではなく、むしろ特徴群の組み合わせによる影響である。
これは、マルチモーダルデータセットを含む機能の自然なグループ化を含むデータセットに特に問題となる可能性がある。
本稿では,GAM(Generalized Additive Models)の機能群の重要性を,効率的でモデル再訓練を必要とせず,グループをポストホックで定義し,重なり合うグループを許可し,高次元設定においても意味のある機能群を決定するための新しいアプローチを提案する。
さらに、この定義は統計学における説明的なバリエーションと平行している。
本稿では, 群重心の挙動を多種多様なデータ構造で示す3つの合成実験において, 提案手法の特性について述べる。
次に,マルチモーダル神経科学データセットからの抑うつ症状の同定における特徴群の重要性を明らかにし,人工股関節全置換術後の健康決定因子の重要性について検討した。
これらの2つのケーススタディは、グループの重要性を分析することで、単一機能分析と比較して、医療上の問題をより正確で全体論的に把握できることを示している。
関連論文リスト
- GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Explaining Clustering of Ecological Momentary Assessment Data Through Temporal and Feature Attention [4.951599300340955]
エコロジー・モメンタリー・アセスメント (Ecological Momentary Assessment, EMA) 研究は、心理病理関連変数の個人データをリアルタイムに提供する。
本稿では,クラスタの識別において主要な役割を担う重要な時間点と変数を識別する,注目に基づく解釈可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-08T07:09:43Z) - Feature graphs for interpretable unsupervised tree ensembles: centrality, interaction, and application in disease subtyping [0.24578723416255746]
特徴の選択は、モデルの解釈可能性を高める上で重要な役割を担います。
決定木を集約することで得られる精度は、解釈可能性の犠牲となる。
この研究では、教師なしランダムな森林から特徴グラフを構築するための新しい手法を紹介した。
論文 参考訳(メタデータ) (2024-04-27T12:47:37Z) - Feature Importance Disparities for Data Bias Investigations [2.184775414778289]
分類器における下流バイアスの1つの原因は、トレーニングデータに存在するバイアスであると広く考えられている。
保護された機能と保護されていない機能からなるデータセットの$X$、結果の$y$、および$X$の$y$を予測するregressor $h$を示す。
機械学習コミュニティは、指数関数的に大きなサブグループクラスでさえ、大きなFID値を持つサブグループを効率的に見つけることができる。
論文 参考訳(メタデータ) (2023-03-03T04:12:04Z) - Composite Feature Selection using Deep Ensembles [130.72015919510605]
本研究では,事前定義されたグループ化を伴わない予測的特徴群発見の問題について検討する。
本稿では,特徴選択モデルのアンサンブルを用いて予測グループを探索する,新しいディープラーニングアーキテクチャを提案する。
発見群と基底真理の類似性を測定するための新しい尺度を提案する。
論文 参考訳(メタデータ) (2022-11-01T17:49:40Z) - Data-IQ: Characterizing subgroups with heterogeneous outcomes in tabular
data [81.43750358586072]
本稿では,サンプルをサブグループに体系的に階層化するフレームワークであるData-IQを提案する。
実世界の4つの医療データセットに対するData-IQの利点を実験的に実証した。
論文 参考訳(メタデータ) (2022-10-24T08:57:55Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Grouped Feature Importance and Combined Features Effect Plot [2.15867006052733]
解釈可能な機械学習は、機械学習アルゴリズムの人気が高まり、研究の活発な領域となっている。
機能グループに対して,既存のモデル非依存手法をどのように定義できるかを包括的に概観し,機能グループの重要性を評価した。
本稿では,特徴のスパースで解釈可能な線形結合に基づいて,特徴群の効果を可視化する手法である複合特徴効果プロットを提案する。
論文 参考訳(メタデータ) (2021-04-23T16:27:38Z) - Statistical Analytics and Regional Representation Learning for COVID-19
Pandemic Understanding [4.731074162093199]
新型コロナウイルスの感染拡大が世界のほぼすべての国に深刻な影響を与えている。
本稿では、統一された情報ソースを提供するために、公開データセットの広範なコレクションを統合し、処理する。
本研究では,予測イベントモデリングのために,DoubleWindowLSTM-CPと呼ばれる特定のRNNベースの推論パイプラインを提案する。
論文 参考訳(メタデータ) (2020-08-08T03:35:16Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。