論文の概要: CheXPO: Preference Optimization for Chest X-ray VLMs with Counterfactual Rationale
- arxiv url: http://arxiv.org/abs/2507.06959v1
- Date: Wed, 09 Jul 2025 15:40:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.648792
- Title: CheXPO: Preference Optimization for Chest X-ray VLMs with Counterfactual Rationale
- Title(参考訳): CheXPO:Chest X線VLMの非現実的推論による優先最適化
- Authors: Xiao Liang, Jiawei Hu, Di Wang, Zhi Ma, Lin Zhao, Ronghan Li, Bo Wan, Quan Wang,
- Abstract要約: 視覚言語モデル(VLM)は、医療応用における信頼性を著しく損なう幻覚の傾向にある。
CheXPOはChest X-ray Preference Optimization(英語版)の戦略であり、信頼-相似的な共同採掘と反実的理性を組み合わせたものである。
実験の結果、CheXPOはSFTサンプルの5%しか使用せずに8.93%の性能向上を達成した。
- 参考スコア(独自算出の注目度): 19.12912235186827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-language models (VLMs) are prone to hallucinations that critically compromise reliability in medical applications. While preference optimization can mitigate these hallucinations through clinical feedback, its implementation faces challenges such as clinically irrelevant training samples, imbalanced data distributions, and prohibitive expert annotation costs. To address these challenges, we introduce CheXPO, a Chest X-ray Preference Optimization strategy that combines confidence-similarity joint mining with counterfactual rationale. Our approach begins by synthesizing a unified, fine-grained multi-task chest X-ray visual instruction dataset across different question types for supervised fine-tuning (SFT). We then identify hard examples through token-level confidence analysis of SFT failures and use similarity-based retrieval to expand hard examples for balancing preference sample distributions, while synthetic counterfactual rationales provide fine-grained clinical preferences, eliminating the need for additional expert input. Experiments show that CheXPO achieves 8.93% relative performance gain using only 5% of SFT samples, reaching state-of-the-art performance across diverse clinical tasks and providing a scalable, interpretable solution for real-world radiology applications.
- Abstract(参考訳): 視覚言語モデル(VLM)は、医療応用における信頼性を著しく損なう幻覚の傾向にある。
好みの最適化は、臨床的なフィードバックを通じてこれらの幻覚を緩和することができるが、その実装は、臨床的に無関係なトレーニングサンプル、不均衡なデータ分布、禁止的な専門家の注釈コストといった課題に直面している。
これらの課題に対処するため,チェストX線予測最適化戦略であるCheXPOを導入する。
我々のアプローチは、教師付き微調整(SFT)のための様々な質問タイプにまたがる、統一された、きめ細かなマルチタスク胸部X線ビジュアルインストラクションデータセットを合成することから始まる。
次に、SFT故障のトークンレベルの信頼度分析を通じてハード例を特定し、類似性に基づく検索を用いて、好みのサンプル分布のバランスをとるためのハード例を拡張する。
実験により、CheXPOはSFTサンプルの5%のみを使用して8.93%の相対的なパフォーマンス向上を実現し、様々な臨床タスクで最先端のパフォーマンスを達成し、実世界の放射線学応用にスケーラブルで解釈可能なソリューションを提供することが示された。
関連論文リスト
- TrialMatchAI: An End-to-End AI-powered Clinical Trial Recommendation System to Streamline Patient-to-Trial Matching [0.0]
本稿では,患者間マッチングを自動化するAIを利用したレコメンデーションシステムTrialMatchAIを提案する。
微調整されたオープンソースの大規模言語モデルに基づいて構築されたTrialMatchAIは、透明性を確保し、軽量なデプロイメントフットプリントを維持する。
現実のバリデーションでは、腫瘍学患者の92%が、少なくとも1つの関連するトライアルを、トップ20のレコメンデーションで回収した。
論文 参考訳(メタデータ) (2025-05-13T12:39:06Z) - MOSIC: Model-Agnostic Optimal Subgroup Identification with Multi-Constraint for Improved Reliability [11.997050225896679]
複数の制約下での最適部分群同定のためのモデルに依存しないフレームワークを提案する。
本手法は安定かつ柔軟であり,観測データを用いて治療効果を推定・最適化するための様々なモデルと技術をサポートしている。
論文 参考訳(メタデータ) (2025-04-29T16:25:23Z) - Embracing Uncertainty Flexibility: Harnessing a Supervised Tree Kernel
to Empower Ensemble Modelling for 2D Echocardiography-Based Prediction of
Right Ventricular Volume [0.5492530316344587]
右室機能低下は,多くの状況において臨床効果を強く予測する。
本稿では,不確実性スコアによるボリューム予測を補完する手法を提案する。
提案手法は意思決定プロセスの強化とリスク低減に有効である。
論文 参考訳(メタデータ) (2024-03-04T12:36:31Z) - UniChest: Conquer-and-Divide Pre-training for Multi-Source Chest X-Ray Classification [36.94690613164942]
UniChestはConquer-and-Divide事前トレーニングフレームワークで、複数のCXRソースのコラボレーション利益をフル活用することを目的としている。
我々は、ChestX-ray14、CheXpert、Vindr-CXR、深セン、Open-I、SIIM-ACR Pneumothoraxなどの多くのベンチマークで徹底的な実験を行った。
論文 参考訳(メタデータ) (2023-12-18T09:16:48Z) - Rethinking Semi-Supervised Medical Image Segmentation: A
Variance-Reduction Perspective [51.70661197256033]
医用画像セグメンテーションのための階層化グループ理論を用いた半教師付きコントラスト学習フレームワークARCOを提案する。
まず、分散還元推定の概念を用いてARCOを構築することを提案し、特定の分散還元技術が画素/ボクセルレベルのセグメンテーションタスクにおいて特に有用であることを示す。
5つの2D/3D医療データセットと3つのセマンティックセグメンテーションデータセットのラベル設定が異なる8つのベンチマークで、我々のアプローチを実験的に検証する。
論文 参考訳(メタデータ) (2023-02-03T13:50:25Z) - Auto-FedRL: Federated Hyperparameter Optimization for
Multi-institutional Medical Image Segmentation [48.821062916381685]
Federated Learning(FL)は、明示的なデータ共有を避けながら協調的なモデルトレーニングを可能にする分散機械学習技術である。
本稿では,Auto-FedRLと呼ばれる,効率的な強化学習(RL)に基づくフェデレーションハイパーパラメータ最適化アルゴリズムを提案する。
提案手法の有効性は,CIFAR-10データセットと2つの実世界の医用画像セグメンテーションデータセットの不均一なデータ分割に対して検証される。
論文 参考訳(メタデータ) (2022-03-12T04:11:42Z) - Multi-Domain Balanced Sampling Improves Out-of-Distribution
Generalization of Chest X-ray Pathology Prediction Models [67.2867506736665]
そこで本研究では, 簡単なバッチサンプリング手法を用いた胸部X線像の分布外一般化法を提案する。
複数のトレーニングデータセット間のバランスの取れたサンプリングは、バランスを取らずにトレーニングされたベースラインモデルよりもパフォーマンスが向上する。
論文 参考訳(メタデータ) (2021-12-27T15:28:01Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。