論文の概要: MedConcept: Unsupervised Concept Discovery for Interpretability in Medical VLMs
- arxiv url: http://arxiv.org/abs/2604.11868v1
- Date: Mon, 13 Apr 2026 17:53:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.037462
- Title: MedConcept: Unsupervised Concept Discovery for Interpretability in Medical VLMs
- Title(参考訳): MedConcept:医療用VLMにおける解釈可能性のための教師なし概念発見
- Authors: Md Rakibul Haque, KM Arefeen Sultan, Tushar Kataria, Shireen Elhabian,
- Abstract要約: 医療ビジョンランゲージモデル(VLM)の解釈可能性は、信頼できる臨床展開に不可欠である。
MedConceptは、完全に教師なしの方法で潜伏する医療概念を明らかにするフレームワークである。
MedConceptは、事前訓練されたVLM表現を擬似レポートスタイルの要約に変換し、医師レベルの内部モデル推論の検査を可能にする。
- 参考スコア(独自算出の注目度): 2.2615829161440546
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While medical Vision-Language models (VLMs) achieve strong performance on tasks such as tumor or organ segmentation and diagnosis prediction, their opaque latent representations limit clinical trust and the ability to explain predictions. Interpretability of these multimodal representations are therefore essential for the trustworthy clinical deployment of pretrained medical VLMs. However, current interpretability methods, such as gradient- or attention-based visualizations, are often limited to specific tasks such as classification. Moreover, they do not provide concept-level explanations derived from shared pretrained representations that can be reused across downstream tasks. We introduce MedConcept, a framework that uncovers latent medical concepts in a fully unsupervised manner and grounds them in clinically verifiable textual semantics. MedConcept identifies sparse neuron-level concept activations from pretrained VLM representations and translates them into pseudo-report-style summaries, enabling physician-level inspection of internal model reasoning. To address the lack of quantitative evaluation in concept-based interpretability, we introduce a quantitative semantic verification protocol that leverages an independent pretrained medical LLM as a frozen external evaluator to assess concept alignment with radiology reports. We define three concept scores, Aligned, Unaligned, and Uncertain, to quantify semantic support, contradiction, or ambiguity relative to radiology reports and use them exclusively for post hoc evaluation. These scores provide a quantitative baseline for assessing interpretability in medical VLMs. All codes, prompt and data to be released on acceptance. Ke
- Abstract(参考訳): 医用ビジョンランゲージモデル(VLM)は腫瘍や臓器のセグメンテーションや診断予測などのタスクにおいて高いパフォーマンスを達成するが、その不透明な潜在表現は臨床信頼と予測を説明する能力を制限する。
したがって、これらのマルチモーダル表現の解釈可能性は、事前訓練された医療用VLMの信頼性の高い臨床展開に不可欠である。
しかしながら、勾配や注意に基づく可視化のような現在の解釈可能性法は、しばしば分類のような特定のタスクに限られる。
さらに、ダウンストリームタスク間で再利用可能な共有事前訓練された表現から導かれる概念レベルの説明も提供していない。
MedConceptは、潜在医療概念を完全に教師なしの方法で発見し、臨床的に検証可能なテキスト意味論に基礎を置くフレームワークである。
MedConceptは、訓練済みのVLM表現からスパースニューロンレベルの概念アクティベーションを特定し、それらを疑似報告スタイルの要約に変換し、医師レベルの内的モデル推論の検査を可能にする。
概念に基づく解釈可能性の定量的評価の欠如に対処するため,我々は,独立した事前学習医療用LCMを凍結外部評価器として活用し,放射線学報告と概念整合性を評価する定量的セマンティック検証プロトコルを導入する。
我々は,3つの概念スコア,Aligned,Unaligned,Uncertainを定義し,放射線学報告に対するセマンティックサポート,矛盾,曖昧性を定量化し,ポストホック評価にのみ使用する。
これらのスコアは、医療用VLMの解釈可能性を評価するための定量的ベースラインを提供する。
すべてのコード、プロンプト、および受け入れ時にリリースされるデータ。
華(け)
関連論文リスト
- MedLayBench-V: A Large-Scale Benchmark for Expert-Lay Semantic Alignment in Medical Vision Language Models [2.0221473384338884]
MedLayBench-Vは、エキスパート・レイ・セマンティックアライメントに特化した最初の大規模マルチモーダル・ベンチマークである。
MedLayBench-Vは、臨床専門家と患者の間のコミュニケーションの分断をブリッジできる次世代のMed-VLMの訓練と評価のための検証された基盤を提供する。
論文 参考訳(メタデータ) (2026-04-07T11:39:41Z) - Vision-Language Models Encode Clinical Guidelines for Concept-Based Medical Reasoning [3.2723884637302443]
概念ボトルネックモデル(Concept Bottleneck Models, CBM)は、AIを解釈するための重要なフレームワークである。
臨床ガイドラインを視覚言語と推論モデルと統合する概念ベースの推論フレームワークであるMedCBRを提案する。
本フレームワークは,医用画像解析から意思決定までの終端ブリッジを構築できる。
論文 参考訳(メタデータ) (2026-03-09T20:39:46Z) - Concept-Enhanced Multimodal RAG: Towards Interpretable and Accurate Radiology Report Generation [12.226029763256962]
VLM(Vision-Language Models)による放射線学レポート生成は、ドキュメントの負担軽減、レポートの一貫性の向上、臨床導入の加速を約束する。
既存の研究では、解釈可能性と精度を別々の目的として扱い、概念に基づく説明可能性技術は透明性に重点を置いている。
本稿では,視覚表現を解釈可能な臨床概念に分解する統合フレームワークであるCEMRAG(Concept-Enhanced Multimodal RAG)を提案する。
論文 参考訳(メタデータ) (2026-02-17T15:18:07Z) - Benchmarking Egocentric Clinical Intent Understanding Capability for Medical Multimodal Large Language Models [48.95516224614331]
MedGaze-Benchは、臨床医の視線を認知的カーソルとして活用し、手術、緊急シミュレーション、診断解釈における意図的理解を評価する最初のベンチマークである。
本ベンチマークでは,解剖学的構造の視覚的均一性,臨床における時間・因果依存性の厳格化,安全プロトコルへの暗黙の順守という3つの基本的な課題に対処する。
論文 参考訳(メタデータ) (2026-01-11T02:20:40Z) - Training and Evaluation of Guideline-Based Medical Reasoning in LLMs [7.814266948607376]
医学における早期予測のための機械学習は、最近、画期的なパフォーマンスを示している。
本研究の目的は,医学コンセンサスガイドラインに従って理学療法と予測過程を段階的に実施することである。
論文 参考訳(メタデータ) (2025-12-03T14:39:02Z) - Weakly Supervised Concept Learning with Class-Level Priors for Interpretable Medical Diagnosis [9.002305517166635]
Prior-Guided Concept Predictor (PCP) は、言語モデルに依存することなく、概念回答の予測を可能にする弱い教師付きフレームワークである。
PCPはゼロショットベースラインに比べてコンセプトレベルのF1スコアを33%以上改善している。
論文 参考訳(メタデータ) (2025-11-03T00:43:04Z) - Uncertainty-Driven Expert Control: Enhancing the Reliability of Medical Vision-Language Models [52.2001050216955]
既存の方法は、モデル構造を調整したり、高品質なデータで微調整したり、好みの微調整によって、医療ビジョン言語モデル(MedVLM)の性能を向上させることを目的としている。
我々は,MedVLMと臨床専門知識の連携を図るために,Expert-Controlled-Free Guidance (Expert-CFG) という,ループ内のエキスパート・イン・ザ・ループフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-12T09:03:30Z) - Uncertainty-aware Medical Diagnostic Phrase Identification and Grounding [72.18719355481052]
MRG(Messical Report Grounding)と呼ばれる新しい課題について紹介する。
MRGは医療報告から診断フレーズとその対応する接地箱を直接エンドツーエンドで識別することを目的としている。
マルチモーダルな大規模言語モデルを用いて診断フレーズを予測する,堅牢で信頼性の高いフレームワークである uMedGround を提案する。
論文 参考訳(メタデータ) (2024-04-10T07:41:35Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Enriching Unsupervised User Embedding via Medical Concepts [51.17532619610099]
教師なしのユーザ埋め込みは、患者を人間の監督なしに、固定長のベクターにエンコードすることを目的としている。
臨床ノートから抽出された医療概念は、患者とその臨床カテゴリ間の豊富な関係を含んでいる。
本稿では,2つの臨床コーパスからテキスト文書と医療概念を共同で活用する,非教師なしユーザ埋め込みを提案する。
論文 参考訳(メタデータ) (2022-03-20T18:54:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。