論文の概要: SHAPCA: Consistent and Interpretable Explanations for Machine Learning Models on Spectroscopy Data
- arxiv url: http://arxiv.org/abs/2603.19141v1
- Date: Thu, 19 Mar 2026 16:58:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.282775
- Title: SHAPCA: Consistent and Interpretable Explanations for Machine Learning Models on Spectroscopy Data
- Title(参考訳): SHAPCA:分光データに基づく機械学習モデルの一貫性と解釈可能な説明
- Authors: Mingxing Zhang, Nicola Rossberg, Simone Innocente, Katarzyna Komolibus, Rekha Gautam, Barry O'Sullivan, Luca Longo, Andrea Visentin,
- Abstract要約: 分光データの高次元性と強いコリニアリティは、説明可能性のモデル化に根本的な課題を生んでいる。
本研究は,主成分分析(次元化のための)と形状付加的展開(ポストホック説明のための)を組み合わせた説明可能な機械学習パイプラインであるSHAPCAを提案する。
提案したフレームワークは、グローバルとローカルの両方の観点からの分析を可能にし、モデル全体の振る舞いを駆動するスペクトル帯域を明らかにする。
- 参考スコア(独自算出の注目度): 3.6869511677142373
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In recent years, machine learning models have been increasingly applied to spectroscopic datasets for chemical and biomedical analysis. For their successful adoption, particularly in clinical and safety-critical settings, professionals and researchers must be able to understand and trust the reasoning behind model predictions. However, the inherently high dimensionality and strong collinearity of spectroscopy data pose a fundamental challenge to model explainability. These properties not only complicate model training but also undermine the stability and consistency of explanations, leading to fluctuations in feature importance across repeated training runs. Feature extraction techniques have been used to reduce the input dimensionality; these new features hinder the connection between the prediction and the original signal. This study proposes SHAPCA, an explainable machine learning pipeline that combines Principal Component Analysis (for dimensionality reduction) and Shapely Additive exPlanations (for post hoc explanation) to provide explanations in the original input space, which a practitioner can interpret and link back to the biological components. The proposed framework enables analysis from both global and local perspectives, revealing the spectral bands that drive overall model behaviour as well as the instance-specific features that influence individual predictions. Numerical analysis demonstrated the interpretability of the results and greater consistency across different runs.
- Abstract(参考訳): 近年, 化学・バイオメディカル分析のための分光分析データセットに機械学習モデルが適用されてきている。
専門家や研究者は、特に臨床および安全性に重要な環境で採用が成功するためには、モデル予測の背後にある理由を理解し、信頼しなければなりません。
しかしながら、分光データの本質的に高次元性と強いコリニア性は、説明可能性のモデル化に根本的な課題をもたらす。
これらの特性は、モデルトレーニングを複雑にするだけでなく、説明の安定性と一貫性を損なう。
特徴抽出技術は入力次元を低減するために使われており、これらの新機能は予測と元の信号との接続を妨げる。
本研究では,主成分分析(次元削減のための)と形状付加的説明(ポストホック説明のための)を組み合わせた説明可能な機械学習パイプラインであるSHAPCAを提案する。
提案したフレームワークは、グローバルとローカルの両方の観点からの分析を可能にし、モデル全体の振る舞いを駆動するスペクトルバンドと、個々の予測に影響を与えるインスタンス固有の特徴を明らかにする。
数値解析により, 結果の解釈可能性と, 異なる実行時間間での一貫性が示された。
関連論文リスト
- FlexMS is a flexible framework for benchmarking deep learning-based mass spectrum prediction tools in metabolomics [22.314786276794717]
化学分子の同定と性質予測は、薬物発見と物質科学の発展において重要な役割を担っている。
深層学習モデルは分子構造スペクトルを予測できるが、全体的な評価は難しい。
我々の貢献は、質量スペクトル予測における多様なモデルアーキテクチャの構築と評価のためのベンチマークフレームワークFlexMSの作成である。
論文 参考訳(メタデータ) (2026-02-26T10:05:01Z) - SIGMA: Scalable Spectral Insights for LLM Collapse [51.863164847253366]
SIGMA(Spectral Inequalities for Gram Matrix Analysis)は,モデル崩壊のための統一的なフレームワークである。
行列のスペクトル上の決定論的境界を導出するベンチマークを利用することで、SIGMAは表現空間の収縮を追跡するために数学的に基底化された計量を提供する。
我々は、SIGMAが状態への遷移を効果的に捉え、崩壊のメカニズムに関する理論的知見の両方を提供することを示した。
論文 参考訳(メタデータ) (2026-01-06T19:47:11Z) - Cross-Entropy Is All You Need To Invert the Data Generating Process [29.94396019742267]
経験的現象は、教師付きモデルが線形な方法で変化の解釈可能な要因を学習できることを示唆している。
近年の自己教師型学習の進歩により,データ生成過程を反転させることで潜在構造を復元できることが示されている。
標準分類タスクにおいても,モデルが線形変換までの変動の基底構造因子の表現を学習することが証明された。
論文 参考訳(メタデータ) (2024-10-29T09:03:57Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - On the Joint Interaction of Models, Data, and Features [82.60073661644435]
本稿では,データとモデル間の相互作用を実験的に解析する新しいツールであるインタラクションテンソルを紹介する。
これらの観測に基づいて,特徴学習のための概念的枠組みを提案する。
この枠組みの下では、一つの仮説に対する期待された精度と一対の仮説に対する合意はどちらも閉形式で導出することができる。
論文 参考訳(メタデータ) (2023-06-07T21:35:26Z) - Trustworthiness of Laser-Induced Breakdown Spectroscopy Predictions via
Simulation-based Synthetic Data Augmentation and Multitask Learning [4.633997895806144]
レーザ誘起分解分光法を用いてスペクトルデータの定量的解析を行う。
我々は、利用可能なトレーニングデータの小さなサイズと、未知のデータに対する推論中の予測の検証に対処する。
論文 参考訳(メタデータ) (2022-10-07T18:00:09Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Analyzing the Effects of Handling Data Imbalance on Learned Features
from Medical Images by Looking Into the Models [50.537859423741644]
不均衡なデータセットでモデルをトレーニングすることは、学習問題にユニークな課題をもたらす可能性がある。
ニューラルネットワークの内部ユニットを深く調べて、データの不均衡処理が学習した機能にどのように影響するかを観察します。
論文 参考訳(メタデータ) (2022-04-04T09:38:38Z) - Spatial machine-learning model diagnostics: a model-agnostic
distance-based approach [91.62936410696409]
本研究は,空間予測誤差プロファイル (SPEP) と空間変数重要度プロファイル (SVIP) を,新しいモデルに依存しない評価・解釈ツールとして提案する。
統計学的手法、線形モデル、ランダムフォレスト、ハイブリッドアルゴリズムのSPEPとSVIPは、顕著な差異と関連する類似性を示している。
この新しい診断ツールは空間データ科学のツールキットを充実させ、MLモデルの解釈、選択、設計を改善する可能性がある。
論文 参考訳(メタデータ) (2021-11-13T01:50:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。