論文の概要: Few-Shot, Now for Real: Medical VLMs Adaptation without Balanced Sets or Validation
- arxiv url: http://arxiv.org/abs/2506.17500v1
- Date: Fri, 20 Jun 2025 22:35:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.444139
- Title: Few-Shot, Now for Real: Medical VLMs Adaptation without Balanced Sets or Validation
- Title(参考訳): 医用VLMは、バランスの取れたセットやバリデーションを使わずに適応する
- Authors: Julio Silva-Rodríguez, Fereshteh Shakeri, Houda Bahig, Jose Dolz, Ismail Ben Ayed,
- Abstract要約: 医用画像解析において視覚言語モデル(VLM)が注目されている。
医学領域では非現実的な適応データの分布について,従来の研究が強く仮定している。
この作業は、これらの好ましいデプロイメントシナリオに挑戦し、現実的で、不均衡で、バリデーションのない適応設定を導入します。
- 参考スコア(独自算出の注目度): 17.875098424936542
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Vision-language models (VLMs) are gaining attention in medical image analysis. These are pre-trained on large, heterogeneous data sources, yielding rich and transferable representations. Notably, the combination of modality-specialized VLMs with few-shot adaptation has provided fruitful results, enabling the efficient deployment of high-performing solutions. However, previous works on this topic make strong assumptions about the distribution of adaptation data, which are unrealistic in the medical domain. First, prior art assumes access to a balanced support set, a condition that breaks the natural imbalance in disease prevalence found in real-world scenarios. Second, these works typically assume the presence of an additional validation set to fix critical hyper-parameters, which is highly data-inefficient. This work challenges these favorable deployment scenarios and introduces a realistic, imbalanced, validation-free adaptation setting. Our extensive benchmark across various modalities and downstream tasks demonstrates that current methods systematically compromise their performance when operating under realistic conditions, occasionally even performing worse than zero-shot inference. Also, we introduce a training-free linear probe that adaptively blends visual and textual supervision. Detailed studies demonstrate that the proposed solver is a strong, efficient baseline, enabling robust adaptation in challenging scenarios.
- Abstract(参考訳): 医用画像解析において視覚言語モデル(VLM)が注目されている。
これらは巨大で不均一なデータソース上で事前訓練され、リッチで転送可能な表現をもたらす。
特に、モダリティ特化VLMと少数ショット適応の組み合わせは実りある結果をもたらし、高性能なソリューションの効率的な展開を可能にした。
しかし、このトピックに関する以前の研究は、医療領域では非現実的な適応データの分布について強い仮定をしている。
第一に、先行技術は、現実のシナリオで見られる病気の頻度の自然な不均衡を破る条件である、バランスの取れたサポートセットへのアクセスを前提としている。
第二に、これらの研究は通常、重要なハイパーパラメータを修正するための追加の検証セットが存在すると仮定する。
この作業は、これらの好ましいデプロイメントシナリオに挑戦し、現実的で、不均衡で、バリデーションのない適応設定を導入します。
様々なモダリティやダウンストリームタスクに対する広範なベンチマークでは、現在の手法が現実的な条件下での動作において、時としてゼロショット推論よりもパフォーマンスが悪く、体系的に性能を損なうことが示されている。
また、視覚とテキストの監督を適応的にブレンドする訓練不要な線形プローブを導入する。
詳細な研究は、提案した解法が強靭で効率的なベースラインであることを示し、挑戦的なシナリオにおいて堅牢な適応を可能にする。
関連論文リスト
- Trustworthy Few-Shot Transfer of Medical VLMs through Split Conformal Prediction [20.94974284175104]
医用視覚言語モデル(VLM)は、前例のない転送機能を示し、データ効率のよい画像分類に採用されている。
この研究は、そのようなモデルを転送する際の信頼性を保証するために、分割共形予測(SCP)フレームワークについて検討する。
そこで我々は,共形シナリオ上でのトランスダクティブ・スプリット・コンフォーマル適応(SCA-T)を提案する。
論文 参考訳(メタデータ) (2025-06-20T22:48:07Z) - Full Conformal Adaptation of Medical Vision-Language Models [17.53651859360999]
大規模に事前訓練された視覚言語モデル(VLM)は、前例のない転送可能性を示している。
この研究は、ますます普及している分割共形予測フレームワークの下で、それらの振る舞いを調査する。
本稿では,事前学習した基礎モデルを協調的に適応・適合するための新しい設定である,完全共形適応を提案する。
論文 参考訳(メタデータ) (2025-06-06T13:32:00Z) - Realistic Test-Time Adaptation of Vision-Language Models [23.972884634610413]
VLM(Vision-Language Models)は、予測性能を改善するために広く活用されている。
トランスダクティブまたはテストタイム適応(TTA)に関する以前の研究は、しばしばデータ分布について強い仮定を下す。
私たちの作業は、これらの好ましいデプロイメントシナリオに挑戦し、より現実的な評価フレームワークを導入します。
論文 参考訳(メタデータ) (2025-01-07T12:17:25Z) - SKADA-Bench: Benchmarking Unsupervised Domain Adaptation Methods with Realistic Validation On Diverse Modalities [55.87169702896249]
Unsupervised Domain Adaptation (DA) は、ラベル付きソースドメインでトレーニングされたモデルを適用して、ラベルなしのターゲットドメインでデータ分散シフトをうまく実行する。
本稿では,再重み付け,マッピング,部分空間アライメントなど,既存の浅層アルゴリズムの完全かつ公平な評価を行う。
本ベンチマークでは,現実的な検証の重要性を強調し,現実的なアプリケーションに対する実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-07-16T12:52:29Z) - Knowledge-grounded Adaptation Strategy for Vision-language Models: Building Unique Case-set for Screening Mammograms for Residents Training [5.819704618007536]
自然画像とテキストペアに事前訓練された視覚言語モデル(VLM)は、医学的文脈に適用した場合、大きな障壁となる。
本稿では, 選択的サンプリング法と強陰性マイニング法を用いて, VLMを医療領域に適応させるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-30T04:04:36Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Better Practices for Domain Adaptation [62.70267990659201]
ドメイン適応(DA)は、ラベルを使わずに、モデルを配置データに適用するためのフレームワークを提供することを目的としている。
DAの明確な検証プロトコルは、文献の悪い実践につながっている。
ドメイン適応手法の3つの分野にまたがる課題を示す。
論文 参考訳(メタデータ) (2023-09-07T17:44:18Z) - Parameter-free Online Test-time Adaptation [19.279048049267388]
実世界の様々なシナリオにおいて,テスト時間適応手法が事前学習されたモデルにどのような効果をもたらすかを示す。
我々は特に「保守的」なアプローチを提案し、ラプラシアン適応最大推定(LAME)を用いてこの問題に対処する。
提案手法では,既存の手法よりもシナリオの平均精度がはるかに高く,メモリフットプリントもはるかに高速である。
論文 参考訳(メタデータ) (2022-01-15T00:29:16Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。