論文の概要: Hallucination Mitigating for Medical Report Generation
- arxiv url: http://arxiv.org/abs/2601.15745v1
- Date: Thu, 22 Jan 2026 08:13:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.540359
- Title: Hallucination Mitigating for Medical Report Generation
- Title(参考訳): 医療報告作成のための幻覚の緩和
- Authors: Ruoqing Zhao, Runze Xia, Piji Li,
- Abstract要約: ファイングラインドされたtextbfReinforced Rewards textbfMedical Report Generation (KERM) を用いた textbfKnowledge-textbf フレームワークを提案する。
本手法は,MedCLIPを知識検索に活用することによりLVLMへの入力を改良し,キュレートされた知識コーパスから関連する病変事実文を取り入れた。
次に,検索した知識が患者の臨床的文脈とコンテキスト的に関連していることを保証するために,新たな浄化モジュールを導入する。
- 参考スコア(独自算出の注目度): 19.773914014955746
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In the realm of medical report generation (MRG), the integration of natural language processing has emerged as a vital tool to alleviate the workload of radiologists. Despite the impressive capabilities demonstrated by large vision language models (LVLMs) in understanding natural language, their susceptibility to generating plausible yet inaccurate claims, known as ``hallucinations'', raises concerns-especially in the nuanced and critical field of medical. In this work, we introduce a framework, \textbf{K}nowledge-\textbf{E}nhanced with Fine-Grained \textbf{R}einforced Rewards \textbf{M}edical Report Generation (KERM), to tackle the issue. Our approach refines the input to the LVLM by first utilizing MedCLIP for knowledge retrieval, incorporating relevant lesion fact sentences from a curated knowledge corpus. We then introduce a novel purification module to ensure the retrieved knowledge is contextually relevant to the patient's clinical context. Subsequently, we employ fine-grained rewards to guide these models in generating highly supportive and clinically relevant descriptions, ensuring the alignment of model's outputs with desired behaviors. Experimental results on IU-Xray and MIMIC-CXR datasets validate the effectiveness of our approach in mitigating hallucinations and enhancing report quality.
- Abstract(参考訳): 医療報告生成(MRG)の領域では、自然言語処理の統合が、放射線技師の作業負荷を軽減する重要なツールとして現れている。
自然言語の理解において大きな視覚言語モデル(LVLM)によって示される印象的な能力にもかかわらず、'hallucinations'として知られる、もっとも正確で不正確なクレームを生成することへの感受性は、特にニュアンスで批判的な医療分野における懸念を高めている。
本稿では,この問題に対処するために,ファイングレードされた \textbf{R}einforced Rewards \textbf{M}edical Report Generation (KERM) を用いたフレームワークである \textbf{K}nowledge-\textbf{E}nhancedを導入する。
本手法は,MedCLIPを知識検索に活用することによりLVLMへの入力を改良し,キュレートされた知識コーパスから関連する病変事実文を取り入れた。
次に,検索した知識が患者の臨床的文脈とコンテキスト的に関連していることを保証するために,新たな浄化モジュールを導入する。
続いて、これらのモデルが高度に支援的かつ臨床的に関係のある記述を生成し、モデル出力と望ましい振る舞いとの整合性を確保するために、きめ細かい報酬を用いる。
IU-XrayおよびMIMIC-CXRデータセットの実験結果から,幻覚の緩和と報告品質の向上に対するアプローチの有効性が検証された。
関連論文リスト
- LLM-Bootstrapped Targeted Finding Guidance for Factual MLLM-based Medical Report Generation [23.74179903717012]
Fact-Flowは,視覚的事実認識のプロセスとレポートの生成を分離する,革新的なフレームワークである。
これは、まず画像から臨床所見を予測し、その後、MLLMに事実的正確性のあるレポートを作成するよう指示することで達成される。
我々のアプローチの重要な進歩は、大規模言語モデル(LLM)を活用してラベル付き医療所見のデータセットを自律的に作成するパイプラインである。
論文 参考訳(メタデータ) (2026-02-28T02:50:20Z) - MRG-R1: Reinforcement Learning for Clinically Aligned Medical Report Generation [23.22547135801011]
医療報告生成のための意味駆動型強化学習(SRL)手法を提案する。
SRLは、言語スタイルの模倣を超えた臨床的正確性に基づく学習を促進する。
IU X線とMIMIC-CXRの2つのデータセットを用いたSRLを用いた医療報告生成の評価を行った。
論文 参考訳(メタデータ) (2025-12-18T03:57:55Z) - Medical large language models are easily distracted [0.8211696054238238]
大規模言語モデル(LLM)は医学を変革する可能性を持っているが、実際の臨床シナリオには、パフォーマンスを妨げる余分な情報が含まれている。
MedDistractQAは,実世界の気晴らしをシミュレートしたUSMLEスタイルの質問を用いたベンチマークである。
論文 参考訳(メタデータ) (2025-04-01T21:34:01Z) - Knowledge Graph-Driven Retrieval-Augmented Generation: Integrating Deepseek-R1 with Weaviate for Advanced Chatbot Applications [45.935798913942904]
構造化バイオメディカル知識と大規模言語モデル(LLM)を組み合わせた革新的なフレームワークを提案する。
本システムでは,年齢関連黄斑変性(AMD)に関する医学的要約から因果関係を同定・精査し,詳細な知識グラフを作成する。
ベクトルベース検索と局所展開言語モデルを用いて,臨床証拠を直接参照して,文脈的に関連性があり,検証可能な応答を生成する。
論文 参考訳(メタデータ) (2025-02-16T12:52:28Z) - Reasoning-Enhanced Healthcare Predictions with Knowledge Graph Community Retrieval [61.70489848327436]
KAREは、知識グラフ(KG)コミュニティレベルの検索と大規模言語モデル(LLM)推論を統合する新しいフレームワークである。
MIMIC-IIIでは最大10.8~15.0%、MIMIC-IVでは12.6~12.7%である。
論文 参考訳(メタデータ) (2024-10-06T18:46:28Z) - Explainable Biomedical Hypothesis Generation via Retrieval Augmented Generation enabled Large Language Models [46.05020842978823]
大規模言語モデル(LLM)はこの複雑なデータランドスケープをナビゲートする強力なツールとして登場した。
RAGGEDは、知識統合と仮説生成を伴う研究者を支援するために設計された包括的なワークフローである。
論文 参考訳(メタデータ) (2024-07-17T07:44:18Z) - Large Language Model Distilling Medication Recommendation Model [58.94186280631342]
大規模言語モデル(LLM)の強力な意味理解と入力非依存特性を利用する。
本研究は, LLMを用いて既存の薬剤推奨手法を変換することを目的としている。
これを軽減するため,LLMの習熟度をよりコンパクトなモデルに伝達する機能レベルの知識蒸留技術を開発した。
論文 参考訳(メタデータ) (2024-02-05T08:25:22Z) - Self-Verification Improves Few-Shot Clinical Information Extraction [73.6905567014859]
大規模言語モデル (LLMs) は、数発のテキスト内学習を通じて臨床キュレーションを加速する可能性を示している。
正確性や解釈可能性に関する問題、特に健康のようなミッションクリティカルな領域ではまだ苦戦している。
本稿では,自己検証を用いた汎用的な緩和フレームワークについて検討する。このフレームワークはLLMを利用して,自己抽出のための証明を提供し,その出力をチェックする。
論文 参考訳(メタデータ) (2023-05-30T22:05:11Z) - Cross-Modal Causal Intervention for Medical Report Generation [107.76649943399168]
放射線医学報告生成(RRG)は, コンピュータ支援診断と薬剤指導に不可欠である。
視覚言語的バイアスによる急激な相関により、正確な病変記述の生成は依然として困難である。
我々はCrossModal Causal Representation Learning (CMCRL)という2段階のフレームワークを提案する。
IU-XrayとMIMIC-CXRの実験により、我々のCMCRLパイプラインは最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - Retrieval-Augmented and Knowledge-Grounded Language Models for Faithful Clinical Medicine [68.7814360102644]
本稿では,Re$3$Writer法を提案する。
本手法が患者の退院指示生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-10-23T16:34:39Z) - Cross-modal Clinical Graph Transformer for Ophthalmic Report Generation [116.87918100031153]
眼科報告生成(ORG)のためのクロスモーダルな臨床グラフ変換器(CGT)を提案する。
CGTは、デコード手順を駆動する事前知識として、臨床関係を視覚特徴に注入する。
大規模FFA-IRベンチマークの実験は、提案したCGTが従来のベンチマーク手法より優れていることを示した。
論文 参考訳(メタデータ) (2022-06-04T13:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。