論文の概要: CRAFT: Clinical Reward-Aligned Finetuning for Medical Image Synthesis
- arxiv url: http://arxiv.org/abs/2605.12650v1
- Date: Tue, 12 May 2026 18:56:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.622995
- Title: CRAFT: Clinical Reward-Aligned Finetuning for Medical Image Synthesis
- Title(参考訳): CRAFT : 医用画像合成のための臨床逆行性ファインタニング
- Authors: Yunsung Chung, Alex El Darzi, Carlo El Khoury, Han Feng, Nassir Marrouche, Jihun Hamm,
- Abstract要約: 臨床アライメントのための基礎モデルに基づくプロキシである臨床アライメントスコア(CAS)を紹介した。
報酬に基づく適応フレームワークであるCRAFTを提案する。
CRAFTは、強力な適応ベースラインよりもCASと下流分類性能を向上する。
- 参考スコア(独自算出の注目度): 9.138093654971831
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation diffusion models can generate photorealistic natural images, but adapting them to medical imaging remains challenging. In medical adaptation, limited labeled data can exacerbate hallucination-like and clinically implausible synthesis, while existing metrics such as FID or Inception Score do not quantify per-image alignment with pathology-relevant criteria. We introduce the Clinical Alignment Score (CAS), a foundation-model-based proxy for clinical alignment that evaluates generated images along four complementary dimensions beyond visual fidelity. Building on CAS, we propose Clinical Reward-Aligned Finetuning (CRAFT), a reward-based adaptation framework that transfers medical knowledge from multimodal large language models and vision-language models through label-conditioned prompt enrichment, clinical checklists, and differentiable reward optimization. Across four diverse modalities, CRAFT improves CAS and downstream classification performance over strong adaptation baselines. Beyond average CAS gains, CRAFT reduces the empirical low-alignment tail below a real-image reference threshold by 5.5-34.7% points relative to the strongest baseline, corresponding to a 20.4% average relative reduction across datasets. These results indicate fewer hallucination-like generations under CAS, and are corroborated by out-of-family evaluator evaluation, structured checklist auditing, memorization analysis, and a blinded physician preference study on CheXpert.
- Abstract(参考訳): 基礎拡散モデルはフォトリアリスティックな自然画像を生成することができるが、それらを医療画像に適用することは依然として困難である。
医学適応において、限定されたラベル付きデータは幻覚様および臨床的に不確実な合成を悪化させる可能性があるが、FIDやInception Scoreのような既存のメトリクスは、病理関連基準による画像毎のアライメントを定量化しない。
臨床アライメントのための基礎モデルに基づくプロキシであるクリニカルアライメントスコア(CAS)を導入し、視覚的忠実度を超える4つの相補的な次元に沿って生成された画像を評価する。
CASを基盤として,多モーダルな大言語モデルと視覚言語モデルから,ラベル条件付きプロンプトエンリッチメント,臨床チェックリスト,および識別可能な報酬最適化を通じて医療知識を伝達する報酬ベース適応フレームワークであるCRAFTを提案する。
CRAFTは4つの多種多様なモダリティに対して、強力な適応ベースラインよりもCASと下流分類性能を改善している。
CRAFTは平均CASゲインを超えて、実像基準閾値以下で経験的な低配向尾を5.5-34.7%減らし、データセット全体の平均相対減少率20.4%に対応する。
これらの結果は,CAS下での幻覚様世代は少なく,家族内評価,構造化チェックリスト監査,暗記分析,およびCheXpertにおける盲検医師の嗜好調査によって裏付けられている。
関連論文リスト
- JI-ADF: Joint-Individual Learning with Adaptive Decision Fusion for Multimodal Skin Lesion Classification [1.57333503756856]
皮膚病変の分類は早期皮膚科診断に不可欠である。
既存のコンピュータ支援システムの多くは、主に皮膚鏡画像に頼り、マルチモーダルな証拠を過小評価している。
皮膚内視鏡画像,臨床写真,構造化された患者のメタデータを統合した3モーダル深層学習フレームワークである textbfJI-ADF を提案する。
論文 参考訳(メタデータ) (2026-04-30T02:48:15Z) - Clinical Cognition Alignment for Gastrointestinal Diagnosis with Multimodal LLMs [63.535652574541764]
MLLM(Multimodal Large Language Models)は医用画像解析において顕著な可能性を示した。
消化器内視鏡におけるそれらの応用は、現在、2つの重要な限界によって妨げられている。
本稿では,これらの課題に対処する新しい臨床認知アライメント(CogAlign)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-21T07:47:37Z) - Clinically Aware Synthetic Image Generation for Concept Coverage in Chest X-ray Models [3.295369583957252]
CARSは臨床特徴ベクトルに標的摂動を適用し、病理所見の挿入と削除を制御できる。
CARS生成画像の微調整は、精度・リコール性能を一貫して改善し、予測の不確実性を低減し、モデルの校正を改善する。
論文 参考訳(メタデータ) (2026-03-16T16:48:51Z) - AgentsEval: Clinically Faithful Evaluation of Medical Imaging Reports via Multi-Agent Reasoning [73.50200033931148]
本稿では,放射線科医の協調診断ワークフローをエミュレートしたマルチエージェントストリーム推論フレームワークであるAgensEvalを紹介する。
評価プロセスを基準定義、エビデンス抽出、アライメント、一貫性スコアなどの解釈可能なステップに分割することで、AgensEvalは明確な推論トレースと構造化された臨床フィードバックを提供する。
実験結果から,AgensEvalは,言い換え,意味的,スタイリスティックな摂動の下でも頑健な臨床的整合性,意味的忠実性,解釈可能な評価を提供することが示された。
論文 参考訳(メタデータ) (2026-01-23T11:59:13Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Clinical Interpretability of Deep Learning Segmentation Through Shapley-Derived Agreement and Uncertainty Metrics [0.05473229173811305]
深層学習モデルは医用画像セグメンテーションにおいて顕著な性能を達成した。
説明可能性の必要性は、臨床実践における受容と統合の確保に依然として不可欠である。
提案手法では,特徴の重要度を評価するために,コントラストレベルのShapley値を用いることを検討した。
論文 参考訳(メタデータ) (2025-12-08T07:06:58Z) - Prompt-Aware Adaptive Elastic Weight Consolidation for Continual Learning in Medical Vision-Language Models [0.0]
医用視覚言語モデルは、医用画像と臨床用語の間の横断的なアライメントを維持する必要がある。
本稿では,新しい連続学習手法であるPrompt-Aware Adaptive Elastic Weight Consolidation (PA-EWC)を紹介する。
実験の結果、PA-EWCは基準法に比べて最大17.58%の破滅的な忘れ込みを減少させることが示された。
論文 参考訳(メタデータ) (2025-11-25T12:22:56Z) - Evaluating Large Language Models for Multimodal Simulated Ophthalmic Decision-Making in Diabetic Retinopathy and Glaucoma Screening [37.69303106863453]
大規模言語モデル(LLM)は、自然言語のプロンプトに基づいて臨床推論をシミュレートすることができるが、眼科におけるそれらの有用性はほとんど解明されていない。
本研究は,GPT-4による網膜底写真の構造的記述の解釈能力について検討した。
300点の注釈付き眼底画像を用いた振り返り診断検査を行った。
論文 参考訳(メタデータ) (2025-07-02T01:35:59Z) - Clinical Evaluation of Medical Image Synthesis: A Case Study in Wireless Capsule Endoscopy [63.39037092484374]
人工知能(AI)に基づく合成データ生成は、臨床医学の届け方を変えることができる。
本研究は,無線カプセル内視鏡(WCE)画像を用いた炎症性腸疾患(IBD)の診断における概念実証による医療用SDGの臨床評価に焦点を当てた。
その結果、TIDE-IIは、最先端の生成モデルと比較して品質が向上し、臨床的に可塑性で、非常に現実的なWCE画像を生成することがわかった。
論文 参考訳(メタデータ) (2024-10-31T19:48:50Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。