論文の概要: CCS: Clinical Consensus Selection for Radiology Report Generation
- arxiv url: http://arxiv.org/abs/2605.30131v1
- Date: Thu, 28 May 2026 15:59:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.459396
- Title: CCS: Clinical Consensus Selection for Radiology Report Generation
- Title(参考訳): CCS : 放射線診断レポート作成のための臨床コンセンサス選択
- Authors: Xi Zhang, Yingshu Li, Zaiqiao Meng, Jake Lever, Edmond S. L. Ho,
- Abstract要約: 本稿では,複数の候補レポートを抽出し,最も臨床的なコンセンサスが高いものを選択するデコーダに依存しない推論時間選択フレームワークを提案する。
CCSはシングルパスデコーディングやBest-of-Nベースラインよりも推論時のパフォーマンスを一貫して改善している。
- 参考スコア(独自算出の注目度): 22.68973031681527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Radiology report generation (RRG) is commonly formulated as a single-path generation task, where a multimodal large language model (MLLM) produces one decoded report as the final output. While recent progress has largely been driven by scaling training data, model capacity, and retrieval mechanisms, improving report quality at inference time remains underexplored. In this work, we observe that fixed radiology MLLMs often generate clinically stronger reports elsewhere in their candidate pool than the one selected by default decoding, suggesting that inference-time decision making remains an overlooked bottleneck. To address this, we propose Clinical Consensus Selection (CCS), a decoder-agnostic inference-time selection framework that samples multiple candidate reports and selects the one with the highest clinical consensus across the rollout pool. CCS unifies text-based utilities with a radiology-adapted utility computed by an image--report-trained multimodal embedder, which measures candidate agreement beyond surface-level textual similarity. Across three datasets and multiple radiology MLLMs, CCS consistently improves inference-time performance over single-path decoding and generic Best-of-N baselines, with particularly clear gains on clinical metrics. Further analysis shows that image-grounded utility forms a selection axis distinct from textual consensus and that substantial headroom remains for improving RRG at inference time.
- Abstract(参考訳): ラジオロジーレポート生成(RRG)は、マルチモーダルな大言語モデル(MLLM)が最終出力として1つのデコードされたレポートを生成する単一パス生成タスクとして一般的に定式化されている。
最近の進歩は、トレーニングデータ、モデルキャパシティ、検索メカニズムのスケーリングによって大きく推進されているが、推測時のレポート品質の改善はいまだに未調査である。
本研究は,固定ラジオロジーMLLMが既定復号法で選択した手法よりも臨床上,候補プールの他所で報告されることが多いことを観察し,推論時間決定のボトルネックがまだ見過ごされていることを示唆する。
そこで本研究では,複数の候補レポートを抽出し,ロールアウトプール全体で最も高い臨床コンセンサスを持つものを選定する,デコーダに依存しない推論時間選択フレームワークであるCCSを提案する。
CCSは、テキストベースのユーティリティを、画像レポートされたマルチモーダル埋め込みによって計算されたラジオロジー適応ユーティリティで統合する。
3つのデータセットと複数の放射線学 MLLM にまたがって、CCS は単一パスのデコーディングと一般的なBest-of-Nベースラインよりも推論時間のパフォーマンスを一貫して改善し、特に臨床測定値の顕著な向上を実現している。
さらに分析したところ、画像接地ユーティリティはテキストコンセンサスとは異なる選択軸を形成し、推論時にRRGを改善するためのかなりのヘッドルームが残っていることがわかった。
関連論文リスト
- CT-FineBench: A Diagnostic Fidelity Benchmark for Fine-Grained Evaluation of CT Report Generation [51.11942945171396]
従来の評価指標は、語彙重なり合いやエンティティマッチングの粗い尺度のみを提供する。
我々はCT-RATEとMerlinのベンチマークであるCT-FineBenchを提案し、CTレポートの微細な事実整合性を評価する。
我々のベンチマークは、綿密な質問回答(QA)ベースのプロセスによって構築されます。
論文 参考訳(メタデータ) (2026-04-27T03:32:46Z) - CWCD: Category-Wise Contrastive Decoding for Structured Medical Report Generation [5.6071155906499115]
Category-Wise Contrastive Decoding (CWCD)は、構造化ラジオロジーレポート生成(SRRG)を強化するために設計された、新しくモジュール化されたフレームワークである。
CWCDは、臨床効果と自然言語生成の指標の両方において、ベースライン法を一貫して上回っている。
論文 参考訳(メタデータ) (2026-04-12T02:10:28Z) - MRG-R1: Reinforcement Learning for Clinically Aligned Medical Report Generation [23.22547135801011]
医療報告生成のための意味駆動型強化学習(SRL)手法を提案する。
SRLは、言語スタイルの模倣を超えた臨床的正確性に基づく学習を促進する。
IU X線とMIMIC-CXRの2つのデータセットを用いたSRLを用いた医療報告生成の評価を行った。
論文 参考訳(メタデータ) (2025-12-18T03:57:55Z) - S-RRG-Bench: Structured Radiology Report Generation with Fine-Grained Evaluation Framework [39.542375803362965]
胸部X線などの診断画像のための放射線診断レポート生成(RRG)は、臨床とAIの両方において重要な役割を担っている。
従来のフリーテキストレポートは冗長性と一貫性のない言語に悩まされ、臨床的に重要な詳細の抽出が複雑になる。
本稿では、データセット構築、モデルトレーニング、新しい評価フレームワークの導入を含む、S-RRGに対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2025-08-04T05:49:41Z) - HC-LLM: Historical-Constrained Large Language Models for Radiology Report Generation [89.3260120072177]
本稿では,放射線学レポート生成のための歴史制約付き大規模言語モデル (HC-LLM) フレームワークを提案する。
胸部X線写真から経時的特徴と経時的特徴を抽出し,疾患の進行を捉える診断報告を行った。
特に,本手法は,テスト中の履歴データなしでも良好に動作し,他のマルチモーダル大規模モデルにも容易に適用可能である。
論文 参考訳(メタデータ) (2024-12-15T06:04:16Z) - Radiology Report Generation Using Transformers Conditioned with
Non-imaging Data [55.17268696112258]
本稿では,胸部X線画像と関連する患者の人口統計情報を統合したマルチモーダルトランスフォーマーネットワークを提案する。
提案ネットワークは、畳み込みニューラルネットワークを用いて、CXRから視覚的特徴を抽出し、その視覚的特徴と患者の人口統計情報のセマンティックテキスト埋め込みを組み合わせたトランスフォーマーベースのエンコーダデコーダネットワークである。
論文 参考訳(メタデータ) (2023-11-18T14:52:26Z) - C^2M-DoT: Cross-modal consistent multi-view medical report generation
with domain transfer network [67.97926983664676]
ドメイン転送ネットワーク(C2M-DoT)を用いたクロスモーダルなマルチビュー医療レポート生成を提案する。
C2M-DoTは、すべてのメトリクスで最先端のベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-09T02:31:36Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - Longitudinal Data and a Semantic Similarity Reward for Chest X-Ray Report Generation [7.586632627817609]
放射線学者は、解釈と報告を必要とする胸部X線(CXR)の量の増加のために、高いバーンアウト率に直面している。
提案するCXRレポートジェネレータは,ワークフローの要素を統合し,強化学習のための新たな報酬を導入する。
本研究の結果から, 提案モデルでは, 最新技術モデルよりも, 放射線学者の報告に適合した報告が生成されることがわかった。
論文 参考訳(メタデータ) (2023-07-19T05:41:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。