論文の概要: Full Conformal Adaptation of Medical Vision-Language Models
- arxiv url: http://arxiv.org/abs/2506.06076v1
- Date: Fri, 06 Jun 2025 13:32:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.490896
- Title: Full Conformal Adaptation of Medical Vision-Language Models
- Title(参考訳): 医用ビジョンランゲージモデルの完全等角適応
- Authors: Julio Silva-Rodríguez, Leo Fillioux, Paul-Henry Cournède, Maria Vakalopoulou, Stergios Christodoulidis, Ismail Ben Ayed, Jose Dolz,
- Abstract要約: 大規模に事前訓練された視覚言語モデル(VLM)は、前例のない転送可能性を示している。
この研究は、ますます普及している分割共形予測フレームワークの下で、それらの振る舞いを調査する。
本稿では,事前学習した基礎モデルを協調的に適応・適合するための新しい設定である,完全共形適応を提案する。
- 参考スコア(独自算出の注目度): 17.53651859360999
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-language models (VLMs) pre-trained at large scale have shown unprecedented transferability capabilities and are being progressively integrated into medical image analysis. Although its discriminative potential has been widely explored, its reliability aspect remains overlooked. This work investigates their behavior under the increasingly popular split conformal prediction (SCP) framework, which theoretically guarantees a given error level on output sets by leveraging a labeled calibration set. However, the zero-shot performance of VLMs is inherently limited, and common practice involves few-shot transfer learning pipelines, which cannot absorb the rigid exchangeability assumptions of SCP. To alleviate this issue, we propose full conformal adaptation, a novel setting for jointly adapting and conformalizing pre-trained foundation models, which operates transductively over each test data point using a few-shot adaptation set. Moreover, we complement this framework with SS-Text, a novel training-free linear probe solver for VLMs that alleviates the computational cost of such a transductive approach. We provide comprehensive experiments using 3 different modality-specialized medical VLMs and 9 adaptation tasks. Our framework requires exactly the same data as SCP, and provides consistent relative improvements of up to 27% on set efficiency while maintaining the same coverage guarantees.
- Abstract(参考訳): 大規模に事前訓練された視覚言語モデル(VLM)は、前例のない伝達能力を示し、医用画像解析に徐々に統合されている。
差別的ポテンシャルは広く研究されているが、信頼性の面は見過ごされている。
この研究は、ラベル付きキャリブレーションセットを利用して出力セット上の与えられたエラーレベルを理論的に保証するSCP(Sip split conformal prediction)フレームワークの下で、それらの振る舞いを調査する。
しかしながら、VLMのゼロショット性能は本質的に制限されており、一般的な実践では、SCPの厳密な交換性仮定を吸収できない、わずかなショット転送学習パイプラインが伴う。
この問題を軽減するために,数ショットの適応セットを用いて各テストデータ点に対してトランスダクティブに動作する,事前学習された基礎モデルを共同で適応・適合する新しい設定法である,完全共形適応を提案する。
さらに,このフレームワークをSS-Textで補完する。これはVLMのための新しいトレーニング不要な線形プローブソルバで,そのようなトランスダクティブアプローチの計算コストを軽減する。
本研究は,3つの異なるモーダル化医療用VLMと9つの適応タスクを用いた包括的実験を行った。
我々のフレームワークはSCPとまったく同じデータを必要とし、同じカバレッジ保証を維持しながら、設定効率を最大27%改善する。
関連論文リスト
- Conformal Prediction for Zero-Shot Models [20.94974284175104]
分割共形予測パラダイムに基づくCLIPモデルの能力について検討する。
本稿では、キャリブレーションとクエリセットを併用してトランスダクティブを動作させるトランスダクティブ学習環境であるConf-OTを提案する。
論文 参考訳(メタデータ) (2025-05-30T15:16:19Z) - Data-Driven Calibration of Prediction Sets in Large Vision-Language Models Based on Inductive Conformal Prediction [0.0]
動的しきい値キャリブレーションとクロスモーダル整合性検証を統合したモデル非依存不確実性定量化法を提案する。
このフレームワークは、様々なキャリブレーションとテストの分割比で安定したパフォーマンスを実現し、医療、自律システム、その他の安全に敏感な領域における現実的な展開の堅牢性を強調している。
この研究は、マルチモーダルAIシステムにおける理論的信頼性と実用性の間のギャップを埋め、幻覚検出と不確実性を考慮した意思決定のためのスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-04-24T15:39:46Z) - Robust Calibration of Large Vision-Language Adapters [17.583536041845402]
本稿では,CLIPに基づくモデル適応における誤校正の重大な問題に対処する。
実験により,0ショットベースラインのキャリブレーション能力を大幅に低下させる,Adapters,Prompt Learning,Test-Time Adaptationなどの一般的なCLIP適応アプローチを実証した。
これらの観測により、各試料の対数範囲をゼロショット予測ロジットに拡大することにより、誤校正を緩和するための単純でモデルに依存しない解が提示される。
論文 参考訳(メタデータ) (2024-07-18T15:27:56Z) - Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。
トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。
広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文 参考訳(メタデータ) (2024-06-07T11:37:45Z) - Large Language Models are Miscalibrated In-Context Learners [22.30783674111999]
本研究では,学習方法の異なる選択にまたがる行動の詳細な分析を行う。
低リソース環境における全ての学習手法に誤校正問題が存在することを観察する。
最大確率で自己認識を行うことで,ロバストかつ校正された予測が得られることがわかった。
論文 参考訳(メタデータ) (2023-12-21T11:55:10Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - Federated Conformal Predictors for Distributed Uncertainty
Quantification [83.50609351513886]
コンフォーマル予測は、機械学習において厳密な不確実性定量化を提供するための一般的なパラダイムとして現れつつある。
本稿では,共形予測を連邦学習環境に拡張する。
本稿では、FL設定に適した部分交換可能性の弱い概念を提案し、それをフェデレート・コンフォーマル予測フレームワークの開発に利用する。
論文 参考訳(メタデータ) (2023-05-27T19:57:27Z) - DLTTA: Dynamic Learning Rate for Test-time Adaptation on Cross-domain
Medical Images [56.72015587067494]
DLTTAと呼ばれるテスト時間適応のための新しい動的学習率調整法を提案する。
本手法は,現在最先端のテスト時間適応法よりも一貫した性能向上を図り,有効かつ高速なテスト時間適応を実現する。
論文 参考訳(メタデータ) (2022-05-27T02:34:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。