論文の概要: A Chain of Diagnosis Framework for Accurate and Explainable Radiology Report Generation
- arxiv url: http://arxiv.org/abs/2508.09566v1
- Date: Wed, 13 Aug 2025 07:32:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.800287
- Title: A Chain of Diagnosis Framework for Accurate and Explainable Radiology Report Generation
- Title(参考訳): 高精度・説明可能な放射線診断のための診断枠組みの確立
- Authors: Haibo Jin, Haoxuan Che, Sunan He, Hao Chen,
- Abstract要約: 臨床的に正確かつ説明可能なRRGの診断過程の連鎖を維持できる,診断の連鎖(CoD)というフレームワークを提案する。
説明可能性を高めるために、診断基盤モジュールは、診断が参照として機能するQA診断と生成された文とを一致させるように設計されている。
本研究は,1)QAペアと病変箱を用いた完全ラベルRRGデータセット,2)病変位置と重症度を記述した報告の精度を評価するための評価ツール,3)CoDの有効性を実証するための広範な実験に導いた。
- 参考スコア(独自算出の注目度): 4.61181046331792
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the progress of radiology report generation (RRG), existing works face two challenges: 1) The performances in clinical efficacy are unsatisfactory, especially for lesion attributes description; 2) the generated text lacks explainability, making it difficult for radiologists to trust the results. To address the challenges, we focus on a trustworthy RRG model, which not only generates accurate descriptions of abnormalities, but also provides basis of its predictions. To this end, we propose a framework named chain of diagnosis (CoD), which maintains a chain of diagnostic process for clinically accurate and explainable RRG. It first generates question-answer (QA) pairs via diagnostic conversation to extract key findings, then prompts a large language model with QA diagnoses for accurate generation. To enhance explainability, a diagnosis grounding module is designed to match QA diagnoses and generated sentences, where the diagnoses act as a reference. Moreover, a lesion grounding module is designed to locate abnormalities in the image, further improving the working efficiency of radiologists. To facilitate label-efficient training, we propose an omni-supervised learning strategy with clinical consistency to leverage various types of annotations from different datasets. Our efforts lead to 1) an omni-labeled RRG dataset with QA pairs and lesion boxes; 2) a evaluation tool for assessing the accuracy of reports in describing lesion location and severity; 3) extensive experiments to demonstrate the effectiveness of CoD, where it outperforms both specialist and generalist models consistently on two RRG benchmarks and shows promising explainability by accurately grounding generated sentences to QA diagnoses and images.
- Abstract(参考訳): 放射線学報告生成(RRG)の進展にもかかわらず、既存の研究は2つの課題に直面している。
1) 臨床効果の成績は,特に病変属性の記載に満足できない。
2) 生成したテキストは説明性に欠けており, 放射線技師の信頼が得られにくい。
これらの課題に対処するために、我々は、異常の正確な記述を生成するだけでなく、その予測の基盤を提供する信頼できるRRGモデルに焦点を当てる。
そこで本研究では,臨床的に正確かつ説明可能なRRGのための診断プロセスの連鎖を維持するための,診断チェーン(CoD)というフレームワークを提案する。
質問応答(QA)ペアを診断会話を通じて生成し,重要な知見を抽出し,正確な生成のためのQA診断を伴う大規模言語モデルを提案する。
説明可能性を高めるために、診断基盤モジュールは、診断が参照として機能するQA診断と生成された文とを一致させるように設計されている。
さらに、画像の異常を検出するために病変接地モジュールを設計し、放射線技師の作業効率をさらに向上させる。
ラベル効率のトレーニングを容易にするため,臨床の整合性を考慮したオムニ教師付き学習戦略を提案し,異なるデータセットからのさまざまなアノテーションを活用する。
私たちの努力は
1)QAペアと病変箱を備えた完全ラベルRRGデータセット
2 病変の位置及び重症度を記載した報告の正確性を評価するための評価ツール
3)2つのRRGベンチマークにおいて、専門家モデルとジェネラリストモデルの両方を一貫して上回り、生成した文章をQA診断と画像に的確にグラウンドすることで、有望な説明可能性を示す。
関連論文リスト
- MedRAG: Enhancing Retrieval-augmented Generation with Knowledge Graph-Elicited Reasoning for Healthcare Copilot [47.77948063906033]
Retrieval-augmented Generation (RAG)は、プライバシーに敏感な電子健康記録を検索するのに適した手法である。
本稿では,医療領域に対する知識グラフ(KG)により強化されたRAGモデルであるMedRAGを提案する。
MedRAGはより具体的な診断の洞察を提供し、誤診率の低減に最先端のモデルを上回っている。
論文 参考訳(メタデータ) (2025-02-06T12:27:35Z) - Towards the Identifiability and Explainability for Personalized Learner
Modeling: An Inductive Paradigm [36.60917255464867]
本稿では,エンコーダ・デコーダモデルにインスパイアされた新しい応答効率応答パラダイムに基づく,識別可能な認知診断フレームワークを提案する。
診断精度を損なうことなく,ID-CDFが効果的に対処できることが示唆された。
論文 参考訳(メタデータ) (2023-09-01T07:18:02Z) - PromptMRG: Diagnosis-Driven Prompts for Medical Report Generation [7.508437260320598]
医療報告作成のための診断駆動プロンプト(PromptMRG)を提案する。
PromptMRGは、追加の疾患分類ブランチを持つエンコーダデコーダアーキテクチャに基づいている。
クロスモーダル機能拡張は、クエリイメージの診断を支援するために、データベースから類似したレポートを検索する。
論文 参考訳(メタデータ) (2023-08-24T07:10:31Z) - DxFormer: A Decoupled Automatic Diagnostic System Based on
Decoder-Encoder Transformer with Dense Symptom Representations [26.337392652262103]
診断指向対話システムは患者の健康状態を照会し、患者との継続的な対話を通じて疾患の予測を行う。
本稿では,診断プロセスを症状調査と疾患診断の2つの段階に分割する,分離された自動診断フレームワークDxFormerを提案する。
提案モデルは,医師の臨床経験を効果的に学習し,症状のリコールと診断精度の点で最先端の結果を得ることができる。
論文 参考訳(メタデータ) (2022-05-08T01:52:42Z) - Factored Attention and Embedding for Unstructured-view Topic-related
Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。
提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文 参考訳(メタデータ) (2022-03-12T15:24:03Z) - BI-RADS-Net: An Explainable Multitask Learning Approach for Cancer
Diagnosis in Breast Ultrasound Images [69.41441138140895]
本稿では,乳房超音波画像における癌検出のための新しい深層学習手法であるBI-RADS-Netを紹介する。
提案手法は, 臨床診断に関連する特徴表現を学習することにより, 乳腺腫瘍の説明と分類を行うタスクを取り入れたものである。
臨床医が医療現場で診断・報告するために使用する形態学的特徴の観点から予測(良性または悪性)の説明が提供される。
論文 参考訳(メタデータ) (2021-10-05T19:14:46Z) - Inheritance-guided Hierarchical Assignment for Clinical Automatic
Diagnosis [50.15205065710629]
臨床診断は、臨床ノートに基づいて患者に診断符号を割り当てることを目的としており、臨床意思決定において重要な役割を担っている。
本稿では,臨床自動診断のための継承誘導階層と共起グラフの伝播を組み合わせた新しい枠組みを提案する。
論文 参考訳(メタデータ) (2021-01-27T13:16:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。