論文の概要: EMAD: Evidence-Centric Grounded Multimodal Diagnosis for Alzheimer's Disease
- arxiv url: http://arxiv.org/abs/2602.19178v1
- Date: Sun, 22 Feb 2026 13:15:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.519043
- Title: EMAD: Evidence-Centric Grounded Multimodal Diagnosis for Alzheimer's Disease
- Title(参考訳): EMAD : Evidence-Centric Grounded Multimodal diagnosis for Alzheimer's Disease
- Authors: Qiuhui Chen, Xuancheng Yao, Zhenglei Zhou, Xinyue Hu, Yi Hong,
- Abstract要約: 構造化アルツハイマー病診断報告を生成する視覚言語フレームワークEMADを提案する。
それぞれの主張は明らかにマルチモーダルな証拠に基づいている。
GTX-Distillは、教師が限定的な監督を受けた教師からモデル生成レポートを運用している学生に接地行動を伝達する。
- 参考スコア(独自算出の注目度): 5.623782023759069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models for medical image analysis often act as black boxes, seldom aligning with clinical guidelines or explicitly linking decisions to supporting evidence. This is especially critical in Alzheimer's disease (AD), where predictions should be grounded in both anatomical and clinical findings. We present EMAD, a vision-language framework that generates structured AD diagnostic reports in which each claim is explicitly grounded in multimodal evidence. EMAD uses a hierarchical Sentence-Evidence-Anatomy (SEA) grounding mechanism: (i) sentence-to-evidence grounding links generated sentences to clinical evidence phrases, and (ii) evidence-to-anatomy grounding localizes corresponding structures on 3D brain MRI. To reduce dense annotation requirements, we propose GTX-Distill, which transfers grounding behavior from a teacher trained with limited supervision to a student operating on model-generated reports. We further introduce Executable-Rule GRPO, a reinforcement fine-tuning scheme with verifiable rewards that enforces clinical consistency, protocol adherence, and reasoning-diagnosis coherence. On the AD-MultiSense dataset, EMAD achieves state-of-the-art diagnostic accuracy and produces more transparent, anatomically faithful reports than existing methods. We will release code and grounding annotations to support future research in trustworthy medical vision-language models.
- Abstract(参考訳): 医療画像分析のための深層学習モデルは、しばしばブラックボックスとして機能し、臨床ガイドラインに沿ったことはめったにない。
これはアルツハイマー病(AD)において特に重要であり、解剖学的および臨床的所見の両方に予測を根拠にすべきである。
本稿では,構造化AD診断レポートを生成する視覚言語フレームワークEMADについて述べる。
EMADは階層的セマンス・エビデンス・解剖機構(SEA)を用いる。
一 臨床証拠書に作成された文章と臨床証拠書とを関連付けること。
(II)エビデンス・トゥ・解剖学的根拠は3次元脳MRI上の対応する構造を局在させる。
GTX-Distillは,教師が限られた指導力を持つ教師からモデル生成レポートを運用する学生に接地行動を伝達する手法である。
さらに, 臨床整合性, プロトコルの付着性, 推論診断コヒーレンスを強制する, 検証可能な報酬を付与した強化細調整方式であるExecutable-Rule GRPOを紹介する。
AD-MultiSenseデータセットでは、EMADは最先端の診断精度を達成し、既存の方法よりも透明性が高く、解剖学的に忠実なレポートを生成する。
我々は、信頼できる医療ビジョン言語モデルにおける将来の研究を支援するために、コードと接地アノテーションをリリースする。
関連論文リスト
- Aligning Findings with Diagnosis: A Self-Consistent Reinforcement Learning Framework for Trustworthy Radiology Reporting [37.57009831483529]
MLLM(Multimodal Large Language Models)は放射線学レポート生成に強い可能性を示している。
本フレームワークは, より詳細な発見のための思考ブロックと, 構造化された疾患ラベルに対する回答ブロックという, 生成を2つの異なる構成要素に再構成する。
論文 参考訳(メタデータ) (2026-01-06T14:17:44Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - RAD: Towards Trustworthy Retrieval-Augmented Multi-modal Clinical Diagnosis [56.373297358647655]
Retrieval-Augmented Diagnosis (RAD)は、下流タスクで直接マルチモーダルモデルに外部知識を注入する新しいフレームワークである。
RADは、複数の医療ソースからの疾患中心の知識の検索と改善、ガイドライン強化コントラスト損失トランスフォーマー、デュアルデコーダの3つの主要なメカニズムで機能する。
論文 参考訳(メタデータ) (2025-09-24T10:36:14Z) - End-to-End Agentic RAG System Training for Traceable Diagnostic Reasoning [52.12425911708585]
Deep-DxSearchは、強化学習(RL)でエンドツーエンドに訓練されたエージェントRAGシステムである。
Deep-DxSearchでは,患者記録と信頼性のある医療知識情報を含む大規模医療検索コーパスを構築した。
実験により、エンドツーエンドのRLトレーニングフレームワークは、プロンプトエンジニアリングやトレーニングフリーなRAGアプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-08-21T17:42:47Z) - REMEMBER: Retrieval-based Explainable Multimodal Evidence-guided Modeling for Brain Evaluation and Reasoning in Zero- and Few-shot Neurodegenerative Diagnosis [6.446611581074913]
検索型マルチモーダル誘導型脳評価・推論モデルREMEMBERについて紹介する。
REMEMBERは、脳MRIスキャンを用いたゼロショットと少数ショットのアルツハイマーの診断を容易にする新しい機械学習フレームワークである。
実験結果から,REMEMBERはゼロショットと少数ショットの堅牢な性能を実現することが示された。
論文 参考訳(メタデータ) (2025-04-12T22:06:15Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - MMLN: Leveraging Domain Knowledge for Multimodal Diagnosis [10.133715767542386]
肺疾患診断のための知識駆動型およびデータ駆動型フレームワークを提案する。
本研究は, 臨床医学ガイドラインに従って診断規則を定式化し, テキストデータから規則の重みを学習する。
テキストと画像データからなるマルチモーダル融合は、肺疾患の限界確率を推定するために設計されている。
論文 参考訳(メタデータ) (2022-02-09T04:12:30Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。