論文の概要: From Adaptation to Generalization: Adaptive Visual Prompting for Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2604.17455v1
- Date: Sun, 19 Apr 2026 14:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.533458
- Title: From Adaptation to Generalization: Adaptive Visual Prompting for Medical Image Segmentation
- Title(参考訳): 適応から一般化へ:医用画像分割のための適応型視覚プロンプト
- Authors: Evren Çetinkaya, Sangmin Lee, Jung Uk Kim, Hong Joo Lee, Nassir Navab,
- Abstract要約: 本稿では,学習可能なプロンプトメモリから入力固有のプロンプトを抽出するAdaptive Prompt Extractionフレームワークを提案する。
メモリは多様なドメイン識別プロンプト表現を格納し、フーリエスペクトルから抽出されたドメイン特徴を介してクエリされる。
2つのメディカルセグメンテーションタスクの実験により、APEXは、目に見えない領域と見えない領域の両方にわたる一般化を著しく改善することを示した。
- 参考スコア(独自算出の注目度): 58.93075548229873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual prompting has emerged as a powerful method for adapting pre-trained models to new domains without updating model parameters. However, existing prompting methods typically optimize a single prompt per domain and apply it uniformly to all inputs, limiting their ability to generalize under intra and inter-domain variability, which is especially critical in the medical field. To address this, we propose APEX, an Adaptive Prompt EXtraction framework that retrieves input-specific prompts from a learnable prompt memory. The memory stores diverse, domain-discriminative prompt representations and is queried via domain features extracted from the Fourier spectrum. To learn robust and discriminative domain features, we introduce a novel Low-Frequency Feature Contrastive (LFC) learning framework that clusters representations from the same domain while separating those from different domains. Extensive experiments on two medical segmentation tasks demonstrate that APEX significantly improves generalization across both seen and unseen domains. Furthermore, it complements any existing backbones and consistently enhances performance, confirming its effectiveness as a plug-and-play prompting solution in medical fields. The code is available at https://github.com/cetinkayaevren/apex/
- Abstract(参考訳): ビジュアルプロンプトは、モデルパラメータを更新することなく、トレーニング済みのモデルを新しいドメインに適応するための強力な方法として登場した。
しかし、既存のプロンプト法は、通常、ドメインごとの1つのプロンプトを最適化し、それを全ての入力に一様に適用し、ドメイン内およびドメイン間の可変性の下で一般化する能力を制限する。
そこで本研究では,学習可能なプロンプトメモリから入力固有のプロンプトを抽出するAdaptive Prompt ExtractionフレームワークであるAPEXを提案する。
メモリは多様なドメイン識別プロンプト表現を格納し、フーリエスペクトルから抽出されたドメイン特徴を介してクエリされる。
頑健で差別的なドメイン特徴を学習するために,異なるドメインを分離しながら同じドメインから表現をクラスタリングするLFC学習フレームワークを導入する。
2つの医学的セグメンテーションタスクに関する大規模な実験により、APEXは、目に見えない領域と見えない領域の両方にわたる一般化を著しく改善することを示した。
さらに、既存のバックボーンを補完し、一貫してパフォーマンスを向上し、医療分野でのプラグアンドプレイプロンプトソリューションとしての有効性を確認する。
コードはhttps://github.com/cetinkayaevren/apex/で入手できる。
関連論文リスト
- QdaVPR: A novel query-based domain-agnostic model for visual place recognition [2.9951269291329905]
視覚的位置認識(VPR)は、その視覚的特徴のみに基づいて画像の位置を予測することを目的としている。
本稿ではQdaVPRと呼ばれる新しいクエリベースのドメインに依存しないVPRモデルを提案する。
複数のVPRベンチマークにおいて、大きなドメインバリエーションを持つ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2026-03-08T02:01:20Z) - HyDA: Hypernetworks for Test Time Domain Adaptation in Medical Imaging Analysis [4.450536872346658]
ドメイン特性を抑圧するのではなく活用する新しいハイパーネットワークフレームワークであるHyDAを紹介する。
具体的には、HyDAは暗黙のドメイン表現を学び、それを使ってモデルパラメータをオンザフライで調整する。
我々はHyDAをMRI脳年齢予測と胸部X線診断の2つの臨床応用で検証した。
論文 参考訳(メタデータ) (2025-03-06T21:17:40Z) - Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.5901368256326]
医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。
DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-19T07:28:33Z) - Role Prompting Guided Domain Adaptation with General Capability Preserve
for Large Language Models [55.51408151807268]
特定のドメインに合わせると、LLM(Large Language Models)は破滅的な忘れを経験する傾向がある。
同時に複数のドメインのための汎用モデルを構築することで、全体的なパフォーマンスが低下することが多い。
RolE Prompting Guided Multi-Domain Adaptation (REGA) 戦略を提案する。
論文 参考訳(メタデータ) (2024-03-05T08:22:41Z) - Memory-Efficient Prompt Tuning for Incremental Histopathology
Classification [69.46798702300042]
本稿では,経済的なメモリコストのモデル一般化ポテンシャルを育成するための,メモリ効率の良いプロンプトチューニングフレームワークを提案する。
乳癌転移分類と上皮間質組織分類の2つの病理組織学的タスクにより,我々の枠組みを広く評価した。
論文 参考訳(メタデータ) (2024-01-22T03:24:45Z) - Domain-Controlled Prompt Learning [49.45309818782329]
既存の素早い学習方法はドメイン認識やドメイン転送機構を欠いていることが多い。
特定のドメインに対するtextbfDomain-Controlled Prompt Learningを提案する。
本手法は,特定の領域画像認識データセットにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-30T02:59:49Z) - Prompting Diffusion Representations for Cross-Domain Semantic
Segmentation [101.04326113360342]
拡散事前学習は、セマンティックセグメンテーションのための並外れた領域一般化結果を達成する。
本研究では,シーンプロンプトとプロンプトランダム化戦略を導入し,セグメンテーションヘッドを訓練する際に,ドメイン不変情報をさらに混乱させる。
論文 参考訳(メタデータ) (2023-07-05T09:28:25Z) - Learning Domain Invariant Prompt for Vision-Language Models [31.581652862478965]
本稿では,メタプロンプト(MetaPrompt)と呼ばれる未確認領域に一般化可能な,固有領域不変プロンプトを直接生成する新しいプロンプト学習パラダイムを提案する。
我々の手法は既存の手法より一貫して大幅に優れています。
論文 参考訳(メタデータ) (2022-12-08T11:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。