論文の概要: DCAT: Dual Cross-Attention Fusion for Disease Classification in Radiological Images with Uncertainty Estimation
- arxiv url: http://arxiv.org/abs/2503.11851v2
- Date: Wed, 19 Mar 2025 12:18:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-20 13:16:45.284447
- Title: DCAT: Dual Cross-Attention Fusion for Disease Classification in Radiological Images with Uncertainty Estimation
- Title(参考訳): DCAT:不確かさ推定を伴う画像診断における疾患分類のための二重断面積固定法
- Authors: Jutika Borah, Hidam Kumarjit Singh,
- Abstract要約: 本稿では,医用画像解析のための新しい二重対向核融合モデルを提案する。
機能統合と解釈可能性における重要な課題に対処する。
提案されたモデルはAUCの99.75%、100%、99.93%、98.69%、AUPRの99.81%、100%、99.97%、96.36%をそれぞれコビッド19、結核、肺炎胸部X線画像、網膜CT画像で達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate and reliable image classification is crucial in radiology, where diagnostic decisions significantly impact patient outcomes. Conventional deep learning models tend to produce overconfident predictions despite underlying uncertainties, potentially leading to misdiagnoses. Attention mechanisms have emerged as powerful tools in deep learning, enabling models to focus on relevant parts of the input data. Combined with feature fusion, they can be effective in addressing uncertainty challenges. Cross-attention has become increasingly important in medical image analysis for capturing dependencies across features and modalities. This paper proposes a novel dual cross-attention fusion model for medical image analysis by addressing key challenges in feature integration and interpretability. Our approach introduces a bidirectional cross-attention mechanism with refined channel and spatial attention that dynamically fuses feature maps from EfficientNetB4 and ResNet34 leveraging multi-network contextual dependencies. The refined features through channel and spatial attention highlights discriminative patterns crucial for accurate classification. The proposed model achieved AUC of 99.75%, 100%, 99.93% and 98.69% and AUPR of 99.81%, 100%, 99.97%, and 96.36% on Covid-19, Tuberculosis, Pneumonia Chest X-ray images and Retinal OCT images respectively. The entropy values and several high uncertain samples give an interpretable visualization from the model enhancing transparency. By combining multi-scale feature extraction, bidirectional attention and uncertainty estimation, our proposed model strongly impacts medical image analysis.
- Abstract(参考訳): 正確な画像分類は放射線学において重要であり、診断決定が患者の結果に大きな影響を及ぼす。
従来のディープラーニングモデルは、根底にある不確実性にもかかわらず、自信過剰な予測を生み出す傾向があり、誤診につながる可能性がある。
注意機構はディープラーニングの強力なツールとして登場し、モデルが入力データの関連部分にフォーカスできるようにする。
機能融合と組み合わせることで、不確実性に対処できる。
クロスアテンションは、機能やモダリティにまたがる依存関係を捉えるために、医療画像解析においてますます重要になっている。
本稿では,機能統合と解釈可能性において重要な課題に対処し,医用画像解析のための新しい二重対向融合モデルを提案する。
提案手法では,マルチネットワークのコンテキスト依存を生かしたEfficientNetB4とResNet34の機能マップを動的に融合する,洗練されたチャネルと空間的注意を伴う双方向のクロスアテンション機構を導入する。
チャネルと空間的注意による洗練された特徴は、正確な分類に不可欠な識別パターンを強調している。
提案されたモデルはAUCの99.75%、100%、99.93%、98.69%、AUPRの99.81%、100%、99.97%、96.36%をそれぞれコビッド19、結核、肺炎胸部X線画像、網膜CT画像で達成した。
エントロピー値といくつかの高い不確実なサンプルは、透明性を高めるモデルから解釈可能な可視化を与える。
マルチスケールの特徴抽出と双方向の注意と不確実性推定を組み合わせることで,提案手法は医用画像解析に強く影響を与える。
関連論文リスト
- Causal Disentanglement for Robust Long-tail Medical Image Generation [80.15257897500578]
そこで本研究では,病的特徴と構造的特徴を独立に生成する新しい医用画像生成フレームワークを提案する。
本稿では,病理所見から導かれる拡散モデルを用いて病理像をモデル化し,種々の対物画像の生成を可能にする。
論文 参考訳(メタデータ) (2025-04-20T01:54:18Z) - An Intrinsically Explainable Approach to Detecting Vertebral Compression Fractures in CT Scans via Neurosymbolic Modeling [9.108675519106319]
脊椎圧迫骨折(VCFs)は骨粗しょう症の一般的な原因であり、潜在的に重篤な結果である。
機会論的診断のような高度なシナリオでは、モデル解釈可能性がAIレコメンデーションの採用の鍵となる。
我々はCTボリュームにおけるVCF検出のためのニューロシンボリックアプローチを導入する。
論文 参考訳(メタデータ) (2024-12-23T04:01:44Z) - Multiscale Latent Diffusion Model for Enhanced Feature Extraction from Medical Images [5.395912799904941]
CTスキャナーモデルと取得プロトコルのバリエーションは、抽出した放射能特性に有意な変動をもたらす。
LTDiff++は医療画像の特徴抽出を強化するために設計されたマルチスケール潜在拡散モデルである。
論文 参考訳(メタデータ) (2024-10-05T02:13:57Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Beyond Images: An Integrative Multi-modal Approach to Chest X-Ray Report
Generation [47.250147322130545]
画像からテキストまでの放射線学レポート生成は,医療画像の発見を記述した放射線学レポートを自動生成することを目的としている。
既存の方法の多くは画像データのみに焦点をあてており、他の患者情報は放射線科医に公開されていない。
胸部X線レポートを生成するための多モードディープニューラルネットワークフレームワークを,非構造的臨床ノートとともにバイタルサインや症状などの構造化された患者データを統合することで提案する。
論文 参考訳(メタデータ) (2023-11-18T14:37:53Z) - Reconstruction of Patient-Specific Confounders in AI-based Radiologic
Image Interpretation using Generative Pretraining [12.656718786788758]
本稿では,DiffChestと呼ばれる自己条件拡散モデルを提案し,胸部X線画像のデータセット上で訓練する。
DiffChest氏は、患者固有のレベルでの分類を説明し、モデルを誤解させる可能性のある要因を視覚化する。
本研究は,医用画像分類における拡散モデルに基づく事前訓練の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2023-09-29T10:38:08Z) - HGT: A Hierarchical GCN-Based Transformer for Multimodal Periprosthetic
Joint Infection Diagnosis Using CT Images and Text [0.0]
補綴関節感染症(PJI)は重篤な合併症である。
現在,CT画像とPJIの数値テキストデータを組み合わせた統一診断基準が確立されていない。
本研究では,ディープラーニングとマルチモーダル技術に基づく診断手法であるHGTを紹介する。
論文 参考訳(メタデータ) (2023-05-29T11:25:57Z) - Brain Imaging-to-Graph Generation using Adversarial Hierarchical Diffusion Models for MCI Causality Analysis [44.45598796591008]
機能的磁気共鳴画像(fMRI)を軽度認知障害解析のための効果的な接続性にマッピングするために,脳画像から画像へのBIGG(Brain Imaging-to-graph generation)フレームワークを提案する。
発電機の階層変換器は、複数のスケールでノイズを推定するように設計されている。
ADNIデータセットの評価は,提案モデルの有効性と有効性を示す。
論文 参考訳(メタデータ) (2023-05-18T06:54:56Z) - MAF-Net: Multiple attention-guided fusion network for fundus vascular
image segmentation [1.3295074739915493]
網膜基底画像の血管を正確に検出するマルチアテンション誘導核融合ネットワーク(MAF-Net)を提案する。
従来のUNetベースのモデルは、長距離依存を明示的にモデル化するため、部分的な情報を失う可能性がある。
提案手法は,いくつかの最先端手法と比較して良好な結果が得られることを示す。
論文 参考訳(メタデータ) (2023-05-05T15:22:20Z) - Towards Reliable Medical Image Segmentation by utilizing Evidential Calibrated Uncertainty [52.03490691733464]
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を利用して、医用画像分割の問題に対する確率と不確実性を明示的にモデル化する。
DeviSには不確実性を考慮したフィルタリングモジュールが組み込まれている。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Diagnose Like a Radiologist: Hybrid Neuro-Probabilistic Reasoning for
Attribute-Based Medical Image Diagnosis [42.624671531003166]
本稿では,属性に基づく医用画像診断のためのハイブリッド型ニューロ確率推論アルゴリズムを提案する。
我々は,ハイブリッド推論アルゴリズムを2つの困難な画像診断タスクに適用することに成功している。
論文 参考訳(メタデータ) (2022-08-19T12:06:46Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Two-Stream Deep Feature Modelling for Automated Video Endoscopy Data
Analysis [45.19890687786009]
内視鏡画像解析のための2ストリームモデルを提案する。
本モデルでは,2つの深い特徴入力を融合させ,それらの関係関係を新たな関係ネットワークモデルによりマッピングする。
論文 参考訳(メタデータ) (2020-07-12T05:24:08Z) - Diagnosis of Coronavirus Disease 2019 (COVID-19) with Structured Latent
Multi-View Representation Learning [48.05232274463484]
最近、コロナウイルス病2019(COVID-19)の流行は世界中で急速に広まっている。
多くの患者と医師の重労働のために、機械学習アルゴリズムによるコンピュータ支援診断が緊急に必要である。
本研究では,CT画像から抽出した一連の特徴を用いて,COVID-19の診断を行うことを提案する。
論文 参考訳(メタデータ) (2020-05-06T15:19:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。