論文の概要: Evaluating Explainable AI Methods in Deep Learning Models for Early Detection of Cerebral Palsy
- arxiv url: http://arxiv.org/abs/2409.00001v1
- Date: Wed, 14 Aug 2024 00:27:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-08 15:50:41.152303
- Title: Evaluating Explainable AI Methods in Deep Learning Models for Early Detection of Cerebral Palsy
- Title(参考訳): 脳性麻痺早期発見のためのディープラーニングモデルにおける説明可能なAI手法の評価
- Authors: Kimji N. Pellano, Inga Strümke, Daniel Groos, Lars Adde, Espen Alexander F. Ihlen,
- Abstract要約: 脳性麻痺(CP)の早期発見は効果的な介入とモニタリングに不可欠である。
本稿では,幼児の動きのビデオ記録から抽出した骨格データを解析し,CPを予測する深層学習法を用いて,説明可能なAI(XAI)手法の信頼性と適用性を検討した。
- 参考スコア(独自算出の注目度): 0.13194391758295113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early detection of Cerebral Palsy (CP) is crucial for effective intervention and monitoring. This paper tests the reliability and applicability of Explainable AI (XAI) methods using a deep learning method that predicts CP by analyzing skeletal data extracted from video recordings of infant movements. Specifically, we use XAI evaluation metrics -- namely faithfulness and stability -- to quantitatively assess the reliability of Class Activation Mapping (CAM) and Gradient-weighted Class Activation Mapping (Grad-CAM) in this specific medical application. We utilize a unique dataset of infant movements and apply skeleton data perturbations without distorting the original dynamics of the infant movements. Our CP prediction model utilizes an ensemble approach, so we evaluate the XAI metrics performances for both the overall ensemble and the individual models. Our findings indicate that both XAI methods effectively identify key body points influencing CP predictions and that the explanations are robust against minor data perturbations. Grad-CAM significantly outperforms CAM in the RISv metric, which measures stability in terms of velocity. In contrast, CAM performs better in the RISb metric, which relates to bone stability, and the RRS metric, which assesses internal representation robustness. Individual models within the ensemble show varied results, and neither CAM nor Grad-CAM consistently outperform the other, with the ensemble approach providing a representation of outcomes from its constituent models.
- Abstract(参考訳): 脳性麻痺(CP)の早期発見は効果的な介入とモニタリングに不可欠である。
本稿では,幼児の動きのビデオ記録から抽出した骨格データを解析し,CPを予測する深層学習法を用いて,説明可能なAI(XAI)手法の信頼性と適用性を検討した。
具体的には、XAI評価指標(信頼性と安定性)を用いて、この特定の医療応用において、クラス活性化マッピング(CAM)とグラディエント重み付きクラス活性化マッピング(Grad-CAM)の信頼性を定量的に評価する。
乳児運動の独自のデータセットを使用し,乳幼児運動の原動力を歪ませることなく骨格データ摂動を適用した。
CP予測モデルはアンサンブルアプローチを利用するので,全体のアンサンブルと個々のモデルの両方に対して,XAIメトリクスのパフォーマンスを評価する。
以上の結果から,XAI法はCP予測に影響を及ぼすキーボディーポイントを効果的に同定し,その説明がデータ摂動に対して堅牢であることが示唆された。
Grad-CAM は RISv 測定で CAM を著しく上回り、速度の点で安定性を測る。
対照的に、CAMは骨の安定性に関連するRISbメートル法と、内部表現の堅牢性を評価するRSRメートル法において、より優れた性能を発揮する。
アンサンブル内の個々のモデルは様々な結果を示し、CAMもGrad-CAMも一貫して他のモデルよりも優れており、アンサンブルのアプローチはその構成モデルから結果の表現を提供する。
関連論文リスト
- Advanced Meta-Ensemble Machine Learning Models for Early and Accurate Sepsis Prediction to Improve Patient Outcomes [0.0]
本報告では, 全身性炎症性反応症候群, 早期警戒スコア, クイックシークエンシャル臓器不全評価など, 従来の敗血症スクリーニングツールの限界について検討する。
本稿では,機械学習技術 - ランダムフォレスト, エクストリームグラディエントブースティング, 決定木モデル - を用いて, セプシスの発症を予測することを提案する。
本研究は,これらのモデルについて,精度,精度,リコール,F1スコア,受信器動作特性曲線の下での領域といった重要な指標を用いて,個別かつ組み合わせたメタアンサンブルアプローチで評価する。
論文 参考訳(メタデータ) (2024-07-11T00:51:32Z) - Machine Learning for ALSFRS-R Score Prediction: Making Sense of the Sensor Data [44.99833362998488]
筋萎縮性側索硬化症(Amyotrophic Lateral Sclerosis、ALS)は、急速に進行する神経変性疾患である。
iDPP@CLEF 2024チャレンジを先導した今回の調査は,アプリから得られるセンサデータを活用することに焦点を当てている。
論文 参考訳(メタデータ) (2024-07-10T19:17:23Z) - From Movements to Metrics: Evaluating Explainable AI Methods in
Skeleton-Based Human Activity Recognition [0.16385815610837165]
本稿では,骨格型HAR領域におけるXAI評価指標の適用性と信頼性の欠如に対処する。
CAM(Class Activation Mapping)とGrad-CAM(Grad-CAM)で確立されたXAIメトリクスを検証した。
以上の結果から, 有効GCNモデルなど特定の文脈において, テキストフェースフルネスは信頼性に欠ける可能性が示唆された。
論文 参考訳(メタデータ) (2024-02-20T07:58:04Z) - Inadequacy of common stochastic neural networks for reliable clinical
decision support [0.4262974002462632]
医療意思決定におけるAIの普及は、倫理的および安全性に関する懸念から、いまだに妨げられている。
しかし、一般的なディープラーニングアプローチは、データシフトによる過信傾向にある。
本研究は臨床応用における信頼性について考察する。
論文 参考訳(メタデータ) (2024-01-24T18:49:30Z) - New Epochs in AI Supervision: Design and Implementation of an Autonomous
Radiology AI Monitoring System [5.50085484902146]
本稿では,放射線学AI分類モデルの性能を実際に監視するための新しい手法を提案する。
予測分散と時間安定性という2つの指標を提案し、AIのパフォーマンス変化のプリエンプティブアラートに使用する。
論文 参考訳(メタデータ) (2023-11-24T06:29:04Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Robustness and Generalization Performance of Deep Learning Models on
Cyber-Physical Systems: A Comparative Study [71.84852429039881]
調査は、センサーの故障やノイズなど、様々な摂動を扱うモデルの能力に焦点を当てている。
我々は,これらのモデルの一般化と伝達学習能力を,アウト・オブ・ディストリビューション(OOD)サンプルに公開することによって検証する。
論文 参考訳(メタデータ) (2023-06-13T12:43:59Z) - Clinical Deterioration Prediction in Brazilian Hospitals Based on
Artificial Neural Networks and Tree Decision Models [56.93322937189087]
超強化ニューラルネットワーク(XBNet)は臨床劣化(CD)を予測するために用いられる
XGBoostモデルはブラジルの病院のデータからCDを予測する最良の結果を得た。
論文 参考訳(メタデータ) (2022-12-17T23:29:14Z) - Ontology-aware Learning and Evaluation for Audio Tagging [56.59107110017436]
平均平均精度(mAP)は、異なる種類の音をそれらの関係を考慮せずに独立したクラスとして扱う。
オントロジー認識平均平均精度(OmAP)は、評価中にAudioSetオントロジー情報を利用することで、mAPの弱点に対処する。
我々は人間の評価を行い、OmAPはmAPよりも人間の知覚と一致していることを示した。
論文 参考訳(メタデータ) (2022-11-22T11:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。