論文の概要: Information Bottleneck-based Causal Attention for Multi-label Medical Image Recognition
- arxiv url: http://arxiv.org/abs/2508.08069v1
- Date: Mon, 11 Aug 2025 15:12:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.16481
- Title: Information Bottleneck-based Causal Attention for Multi-label Medical Image Recognition
- Title(参考訳): マルチラベル医用画像認識のためのインフォメーション・ボトルネックに基づく因果注意
- Authors: Xiaoxiao Cui, Yiran Li, Kai He, Shanzhi Jiang, Mengli Xue, Wentao Li, Junhong Leng, Zhi Liu, Lizhen Cui, Shuo Li,
- Abstract要約: 本稿では,クラス固有の注意を因果関係,刺激要因,雑音要因の混合として扱う新しい構造因果モデル(SCM)を提案する。
そこで我々は,医用画像に対する識別的クラス固有の注意を学習できる新しい情報ボトルネック型因果注意(IBCA)を提案する。
- 参考スコア(独自算出の注目度): 23.458130705598204
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label classification (MLC) of medical images aims to identify multiple diseases and holds significant clinical potential. A critical step is to learn class-specific features for accurate diagnosis and improved interpretability effectively. However, current works focus primarily on causal attention to learn class-specific features, yet they struggle to interpret the true cause due to the inadvertent attention to class-irrelevant features. To address this challenge, we propose a new structural causal model (SCM) that treats class-specific attention as a mixture of causal, spurious, and noisy factors, and a novel Information Bottleneck-based Causal Attention (IBCA) that is capable of learning the discriminative class-specific attention for MLC of medical images. Specifically, we propose learning Gaussian mixture multi-label spatial attention to filter out class-irrelevant information and capture each class-specific attention pattern. Then a contrastive enhancement-based causal intervention is proposed to gradually mitigate the spurious attention and reduce noise information by aligning multi-head attention with the Gaussian mixture multi-label spatial. Quantitative and ablation results on Endo and MuReD show that IBCA outperforms all methods. Compared to the second-best results for each metric, IBCA achieves improvements of 6.35\% in CR, 7.72\% in OR, and 5.02\% in mAP for MuReD, 1.47\% in CR, and 1.65\% in CF1, and 1.42\% in mAP for Endo.
- Abstract(参考訳): 医療画像のマルチラベル分類(MLC)は、複数の疾患を同定し、臨床的に有意な可能性を秘めている。
重要なステップは、正確な診断と解釈可能性の改善のために、クラス固有の特徴を効果的に学習することである。
しかし、現在の研究は、主にクラス固有の特徴を学ぶための因果的注意に焦点を当てているが、クラス非関連特徴への不注意から真の原因を理解するのに苦慮している。
この課題に対処するために、クラス固有の注意を因果、刺激、ノイズの混合として扱う新しい構造因果モデル(SCM)と、医用画像のMDCに対する識別的なクラス固有の注意を学習できる新しい情報ボトルネックに基づく因果注意(IBCA)を提案する。
具体的には,クラス非関連情報を抽出し,各クラス固有の注意パターンを抽出するために,ガウス混合学習法を提案する。
そこで, コントラッシブエンハンスメントに基づく因果介入を提案し, 突発的な注意を徐々に軽減し, マルチヘッドの注意をガウス混合多ラベル空間と整合させることによりノイズ情報を低減する。
Endo, MuReDの定量, アブレーションの結果から, IBCAはすべての方法に優れていた。
IBCAは各測定値の2番目の値と比較すると、CRの6.35\%、ORの7.72\%、MuleDの5.02\%、CRの1.47\%、CF1の1.65\%、Endoの1.42\%の改善を達成している。
関連論文リスト
- Cross-Modal Clustering-Guided Negative Sampling for Self-Supervised Joint Learning from Medical Images and Reports [11.734906190235066]
本稿では,2次元のアイデアを用いたCross-Modal Cluster-Guided Negative Smpling (CM-CGNS)法を提案する。
まず、シングルモーダルドメインのローカルテキスト機能に使用されるk-meansクラスタリングを、クロスモーダルアテンションを通じてマルチモーダルドメインに拡張する。
第2に、マスクされた局所画像領域を再構成するために、クロスモーダルアテンションによって得られたローカルテキストと画像の特徴を利用する、CM-MIR(Cross-Modal Masked Image Reconstruction)モジュールを導入する。
論文 参考訳(メタデータ) (2025-06-13T11:08:16Z) - MSA-UNet3+: Multi-Scale Attention UNet3+ with New Supervised Prototypical Contrastive Loss for Coronary DSA Image Segmentation [8.850534640462081]
冠状DSA画像のセグメンテーションを高めるために,教師付きおよび原型的コントラスト学習を融合させるスーパービジョン型コントラスト損失を提案する。
MSA-UNet3+: Multi-Scale Attention-Enhanced UNet3+アーキテクチャで提案したSPCL損失を実装した。
プライベート冠DSAデータセットの実験では、MSA-UNet3+が最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2025-04-07T15:35:30Z) - MedFocusCLIP : Improving few shot classification in medical datasets using pixel wise attention [1.2277343096128712]
本稿では,CLIP(Contrastive Language- Image Pretraining)における視覚的エンコーダを支援する視覚的プロンプトキューとして,Segment Anything Model 2(SAM2)の高度なセグメンテーション機能を活用することを提案する。
これにより、視覚的に類似したバックグラウンド機能に気を散らすことなく、非常に差別的な領域に集中することができる。
提案手法は,X線,CTスキャン,MRI画像など多種多様な医療データセットを用いて評価し,提案手法の精度(71%,81%,86%,58%)を報告する。
論文 参考訳(メタデータ) (2025-01-07T14:49:12Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。
我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。
多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文 参考訳(メタデータ) (2023-06-15T17:55:05Z) - RoS-KD: A Robust Stochastic Knowledge Distillation Approach for Noisy
Medical Imaging [67.02500668641831]
ノイズの多いデータセットでトレーニングされたディープラーニングモデルは、ノイズタイプに敏感であり、目に見えないサンプルの一般化が少なくなる。
本稿では,複数の情報源からトピックを学習する概念を模倣したロバスト知識蒸留(RoS-KD)フレームワークを提案する。
RoS-KDは、訓練データの重複する部分集合について訓練された複数の教師から知識を蒸留することにより、滑らかで、よく表現された、堅牢な学生多様体を学習する。
論文 参考訳(メタデータ) (2022-10-15T22:32:20Z) - Learning Discriminative Representation via Metric Learning for
Imbalanced Medical Image Classification [52.94051907952536]
本稿では,特徴抽出器がより識別的な特徴表現を抽出するのを助けるために,2段階フレームワークの第1段階にメトリック学習を組み込むことを提案する。
主に3つの医用画像データセットを用いて実験したところ、提案手法は既存の1段階と2段階のアプローチより一貫して優れていた。
論文 参考訳(メタデータ) (2022-07-14T14:57:01Z) - Dynamic Sub-Cluster-Aware Network for Few-Shot Skin Disease
Classification [31.539129126161978]
本稿では,まれな皮膚疾患の診断における精度を高めるためのサブクラスタ・アウェア・ネットワーク(SCAN)という新しいアプローチを提案する。
SCANの設計を動機づける重要な洞察は、クラス内の皮膚疾患の画像が複数のサブクラスタを示すことが多いという観察である。
数発の皮膚疾患分類のための2つのパブリックデータセットに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2022-07-03T16:06:04Z) - Categorical Relation-Preserving Contrastive Knowledge Distillation for
Medical Image Classification [75.27973258196934]
そこで本研究では,一般的な平均教師モデルであるCRCKD(Categorical Relation-Reserving Contrastive Knowledge Distillation)アルゴリズムを提案する。
この正規化により、学生モデルの特徴分布はクラス内類似度が高く、クラス間分散を示す。
CCDとCRPの貢献により、我々のCRCKDアルゴリズムはより包括的に関係知識を蒸留することができる。
論文 参考訳(メタデータ) (2021-07-07T13:56:38Z) - Multiple Sclerosis Lesion Activity Segmentation with Attention-Guided
Two-Path CNNs [49.32653090178743]
畳み込みニューラルネットワーク(CNN)は2つの時点から病変活動のセグメンテーションについて研究されている。
CNNは、異なる方法で2つのポイントからの情報を組み合わせて設計され、評価される。
深層学習に基づく手法が古典的アプローチより優れていることが実証された。
論文 参考訳(メタデータ) (2020-08-05T08:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。