論文の概要: CURE: Curriculum-guided Multi-task Training for Reliable Anatomy Grounded Report Generation
- arxiv url: http://arxiv.org/abs/2601.15408v1
- Date: Wed, 21 Jan 2026 19:19:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.395589
- Title: CURE: Curriculum-guided Multi-task Training for Reliable Anatomy Grounded Report Generation
- Title(参考訳): CURE:信頼性のある解剖学的基盤レポート生成のためのカリキュラム誘導マルチタスクトレーニング
- Authors: Pablo Messina, Andrés Villa, Juan León Alcázar, Karen Sánchez, Carlos Hinojosa, Denis Parra, Álvaro Soto, Bernard Ghanem,
- Abstract要約: CUREは医療ビジョン言語モデルのためのエラー対応カリキュラム学習フレームワークである。
フレーズ接地、接地レポート生成、解剖学的接地レポート生成に関するマルチモーダル指導モデルを微調整する。
CUREは接地精度を+0.37 IoUで改善し、レポート品質を+0.188 CXRFEScoreで改善し、幻覚を18.6%減らす。
- 参考スコア(独自算出の注目度): 46.0800756149113
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Medical vision-language models can automate the generation of radiology reports but struggle with accurate visual grounding and factual consistency. Existing models often misalign textual findings with visual evidence, leading to unreliable or weakly grounded predictions. We present CURE, an error-aware curriculum learning framework that improves grounding and report quality without any additional data. CURE fine-tunes a multimodal instructional model on phrase grounding, grounded report generation, and anatomy-grounded report generation using public datasets. The method dynamically adjusts sampling based on model performance, emphasizing harder samples to improve spatial and textual alignment. CURE improves grounding accuracy by +0.37 IoU, boosts report quality by +0.188 CXRFEScore, and reduces hallucinations by 18.6%. CURE is a data-efficient framework that enhances both grounding accuracy and report reliability. Code is available at https://github.com/PabloMessina/CURE and model weights at https://huggingface.co/pamessina/medgemma-4b-it-cure
- Abstract(参考訳): 医用視覚言語モデルは、放射線学レポートを自動生成するが、正確な視覚的根拠と事実整合性に苦慮する。
既存のモデルは、しばしば視覚的証拠を伴うテキストの発見を誤認し、信頼できない、または弱い根拠の予測につながる。
CUREは誤り認識型カリキュラム学習フレームワークで,付加データなしでグラウンド化とレポート品質の向上を実現している。
CUREは、フレーズグラウンド、グラウンドドレポート生成、およびパブリックデータセットを用いた解剖学的グラウンドドレポート生成に関するマルチモーダル・インストラクション・モデルである。
本手法は, モデル性能に基づくサンプリングを動的に調整し, より硬いサンプルを強調し, 空間的およびテキスト的アライメントを改善する。
CUREは接地精度を+0.37 IoUで改善し、レポート品質を+0.188 CXRFEScoreで改善し、幻覚を18.6%減らす。
CUREは、基盤精度とレポート信頼性の両方を向上させる、データ効率のよいフレームワークである。
コードはhttps://github.com/PabloMessina/CUREで、モデルウェイトはhttps://huggingface.co/pamessina/medgemma-4b-it-cureで入手できる。
関連論文リスト
- Phrase-grounded Fact-checking for Automatically Generated Chest X-ray Reports [6.758140018768657]
本稿では, 自動生成胸部X線診断レポートにおいて, 発見箇所の誤りを検知する新しいフレーズグラウンドド・ファクトチェック・モデル(FCモデル)を提案する。
提案手法は, 画像と実・偽の発見位置のペアを形成するために, 解析結果の摂動とその位置から得られた大規模な合成データセットを用いて, レポート中の誤りをシミュレートする。
論文 参考訳(メタデータ) (2025-09-20T04:33:44Z) - Leveraging Language Models for Automated Patient Record Linkage [0.5461938536945723]
本研究では,言語モデルを用いた患者記録自動リンクの実現可能性について検討した。
我々はミズーリ癌登録研究センターの実際の医療データを活用している。
論文 参考訳(メタデータ) (2025-04-21T17:41:15Z) - Semantic Consistency-Based Uncertainty Quantification for Factuality in Radiology Report Generation [20.173287130474797]
生成医療ビジョン大言語モデル(VLLM)は幻覚を起こしやすく、不正確な診断情報を生成できる。
報告レベルと文レベルの不確実性の両方を提供するセマンティック一貫性に基づく不確実性定量化フレームワークを新たに導入する。
提案手法は,MIMIC-CXRデータセット上のtexttRadialogモデルを用いて,20ドル分のレポートを拒否することで,事実性スコアを10ドル%改善する。
論文 参考訳(メタデータ) (2024-12-05T20:43:39Z) - Text2Data: Low-Resource Data Generation with Textual Control [100.5970757736845]
Text2Dataは、ラベルのないデータを使って基盤となるデータ配布を理解する新しいアプローチである。
制御性を確保し、破滅的な忘れを効果的に防止する、制約最適化に基づく新たな学習目標を通じて微調整を行う。
論文 参考訳(メタデータ) (2024-02-08T03:41:39Z) - Automatic Radiology Report Generation by Learning with Increasingly Hard
Negatives [23.670280341513795]
本稿では,識別画像を学習し,特徴を報告する新しい枠組みを提案する。
それらが最も近い仲間、すなわち強陰性と区別される。
既存の医療報告生成モデルを簡単に改善するためのプラグインとして機能する。
論文 参考訳(メタデータ) (2023-05-11T23:12:13Z) - Dynamic Graph Enhanced Contrastive Learning for Chest X-ray Report
Generation [92.73584302508907]
コントラスト学習を用いた医療レポート作成を支援するために,動的構造とノードを持つ知識グラフを提案する。
詳しくは、グラフの基本構造は一般知識から事前構築される。
各イメージ機能は、レポート生成のためにデコーダモジュールに入力する前に、独自の更新グラフに統合される。
論文 参考訳(メタデータ) (2023-03-18T03:53:43Z) - mFACE: Multilingual Summarization with Factual Consistency Evaluation [79.60172087719356]
抽象的な要約は、事前訓練された言語モデルと大規模データセットの可用性のおかげで、近年で新たな関心を集めている。
有望な結果にもかかわらず、現在のモデルはいまだに現実的に矛盾した要約を生み出すことに苦しむ。
事実整合性評価モデルを利用して、多言語要約を改善する。
論文 参考訳(メタデータ) (2022-12-20T19:52:41Z) - Self-Training with Improved Regularization for Sample-Efficient Chest
X-Ray Classification [80.00316465793702]
挑戦的なシナリオで堅牢なモデリングを可能にするディープラーニングフレームワークを提案する。
その結果,85%のラベル付きデータを用いて,大規模データ設定で学習した分類器の性能に適合する予測モデルを構築することができた。
論文 参考訳(メタデータ) (2020-05-03T02:36:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。