論文の概要: MCA-RG: Enhancing LLMs with Medical Concept Alignment for Radiology Report Generation
- arxiv url: http://arxiv.org/abs/2507.06992v1
- Date: Wed, 09 Jul 2025 16:15:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.666453
- Title: MCA-RG: Enhancing LLMs with Medical Concept Alignment for Radiology Report Generation
- Title(参考訳): MCA-RG:放射線診断レポート作成のための医療概念アライメントによるLCMの強化
- Authors: Qilong Xing, Zikai Song, Youjia Zhang, Na Feng, Junqing Yu, Wei Yang,
- Abstract要約: Medical Concept Aligned Radiology Report Generation (MCA-RG) は、視覚的特徴と異なる医療概念を整合させてレポート生成プロセスを強化する知識駆動型フレームワークである。
MCA-RGは、病変関連知識を含む病理バンクと解剖学的記述を持つ解剖バンクという、2つの治療された概念バンクを使用している。
- 参考スコア(独自算出の注目度): 10.424282401959468
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite significant advancements in adapting Large Language Models (LLMs) for radiology report generation (RRG), clinical adoption remains challenging due to difficulties in accurately mapping pathological and anatomical features to their corresponding text descriptions. Additionally, semantic agnostic feature extraction further hampers the generation of accurate diagnostic reports. To address these challenges, we introduce Medical Concept Aligned Radiology Report Generation (MCA-RG), a knowledge-driven framework that explicitly aligns visual features with distinct medical concepts to enhance the report generation process. MCA-RG utilizes two curated concept banks: a pathology bank containing lesion-related knowledge, and an anatomy bank with anatomical descriptions. The visual features are aligned with these medical concepts and undergo tailored enhancement. We further propose an anatomy-based contrastive learning procedure to improve the generalization of anatomical features, coupled with a matching loss for pathological features to prioritize clinically relevant regions. Additionally, a feature gating mechanism is employed to filter out low-quality concept features. Finally, the visual features are corresponding to individual medical concepts, and are leveraged to guide the report generation process. Experiments on two public benchmarks (MIMIC-CXR and CheXpert Plus) demonstrate that MCA-RG achieves superior performance, highlighting its effectiveness in radiology report generation.
- Abstract(参考訳): 放射線学報告生成 (RRG) における言語モデル (LLM) の適応は著しく進歩しているが, 病的特徴や解剖学的特徴を対応するテキスト記述に正確にマッピングすることが困難であるため, 臨床応用は依然として困難である。
さらに、意味非依存的特徴抽出は、正確な診断レポートの生成をさらに妨げている。
これらの課題に対処するために,我々は,視覚的特徴と異なる医療的概念を明確に整合させてレポート生成プロセスを強化する知識駆動型フレームワークであるMCA-RG(Messical Concept Aligned Radiology Report Generation)を紹介した。
MCA-RGは、病変関連知識を含む病理バンクと解剖学的記述を持つ解剖バンクという、2つの治療された概念バンクを使用している。
視覚的特徴は、これらの医療概念と整合し、調整された拡張を行う。
さらに、解剖学的特徴の一般化を改善するための解剖学的手法と、臨床関連領域の優先順位付けのための病理学的特徴の一致した損失を提案する。
さらに,低品質なコンセプト機能をフィルタリングする機能ゲーティング機構も採用されている。
最後に、視覚的特徴は個々の医療概念に対応し、レポート生成プロセスのガイドとして活用される。
2つの公開ベンチマーク(MIMIC-CXRとCheXpert Plus)の実験は、MCA-RGが優れた性能を発揮することを示した。
関連論文リスト
- CBM-RAG: Demonstrating Enhanced Interpretability in Radiology Report Generation with Multi-Agent RAG and Concept Bottleneck Models [1.7042756021131187]
本稿では,CBM(Concept Bottleneck Models)とRAG(Multi-Agent Retrieval-Augmented Generation)システムを組み合わせた自動放射線学レポート生成フレームワークを提案する。
CBMは胸部X線の特徴を人間の理解できない臨床概念にマッピングし、透明な疾患分類を可能にする。
RAGシステムはマルチエージェントのコラボレーションと外部知識を統合し、文脈的にリッチなエビデンスベースのレポートを生成する。
論文 参考訳(メタデータ) (2025-04-29T16:14:55Z) - MedGrad E-CLIP: Enhancing Trust and Transparency in AI-Driven Skin Lesion Diagnosis [2.9540164442363976]
この研究は、異なる皮膚病変データセットに基づいて訓練されたCLIP(Contrastive Language- Image Pretraining)モデルを用いて、視覚的特徴と診断基準項の間の有意義な関係を捉える。
皮膚病変などの複雑な医用画像に重み付けされたエントロピー機構を組み込むことにより,勾配に基づくE-CLIP上に構築するMedGrad E-CLIP法を提案する。
画像の異なる特徴が診断基準とどのように関連しているかを視覚的に説明することにより、医用画像解析における高度な視覚言語モデルの可能性を示す。
論文 参考訳(メタデータ) (2025-01-12T17:50:47Z) - ProjectedEx: Enhancing Generation in Explainable AI for Prostate Cancer [14.372695272204632]
我々は,解釈可能な多属性説明を提供する生成フレームワークであるProjectedExを提案する。
第二に,機能ピラミッドを組み込むことでエンコーダモジュールを強化し,マルチスケールフィードバックにより潜伏空間を改良する。
第3に,ジェネレータと分類器の両方について総合的な実験を行い,ProjectedExの臨床的意義と有効性を示した。
論文 参考訳(メタデータ) (2025-01-02T18:07:36Z) - Anatomy-guided Pathology Segmentation [56.883822515800205]
本研究では, 解剖学的特徴と病理学的情報を組み合わせた汎用的セグメンテーションモデルを構築し, 病理学的特徴のセグメンテーション精度を高めることを目的とする。
我々の解剖学・病理学交流(APEx)訓練では,ヒト解剖学の問合せ表現に結合特徴空間をデコードする問合せベースのセグメンテーション変換器を用いている。
これにより、FDG-PET-CTとChest X-Rayの病理分類タスクにおいて、強力なベースライン法に比べて最大3.3%のマージンで、ボード全体で最高の結果を報告できる。
論文 参考訳(メタデータ) (2024-07-08T11:44:15Z) - PromptMRG: Diagnosis-Driven Prompts for Medical Report Generation [7.508437260320598]
医療報告作成のための診断駆動プロンプト(PromptMRG)を提案する。
PromptMRGは、追加の疾患分類ブランチを持つエンコーダデコーダアーキテクチャに基づいている。
クロスモーダル機能拡張は、クエリイメージの診断を支援するために、データベースから類似したレポートを検索する。
論文 参考訳(メタデータ) (2023-08-24T07:10:31Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z) - BI-RADS-Net: An Explainable Multitask Learning Approach for Cancer
Diagnosis in Breast Ultrasound Images [69.41441138140895]
本稿では,乳房超音波画像における癌検出のための新しい深層学習手法であるBI-RADS-Netを紹介する。
提案手法は, 臨床診断に関連する特徴表現を学習することにより, 乳腺腫瘍の説明と分類を行うタスクを取り入れたものである。
臨床医が医療現場で診断・報告するために使用する形態学的特徴の観点から予測(良性または悪性)の説明が提供される。
論文 参考訳(メタデータ) (2021-10-05T19:14:46Z) - Act Like a Radiologist: Towards Reliable Multi-view Correspondence
Reasoning for Mammogram Mass Detection [49.14070210387509]
マンモグラム質量検出のための解剖学的グラフ畳み込みネットワーク(AGN)を提案する。
AGNはマンモグラムの質量検出用に調整されており、既存の検出手法を多視点推論能力で実現している。
2つの標準ベンチマークの実験によると、AGNは最先端のパフォーマンスを大幅に上回っている。
論文 参考訳(メタデータ) (2021-05-21T06:48:34Z) - Auxiliary Signal-Guided Knowledge Encoder-Decoder for Medical Report
Generation [107.3538598876467]
放射線技師の動作パターンを模倣する補助信号誘導知識デコーダ(ASGK)を提案する。
ASGKは、内的特徴融合と外部医療言語情報を統合して、医療知識の伝達と学習をガイドする。
論文 参考訳(メタデータ) (2020-06-06T01:00:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。