論文の概要: Prmpt2Adpt: Prompt-Based Zero-Shot Domain Adaptation for Resource-Constrained Environments
- arxiv url: http://arxiv.org/abs/2506.16994v1
- Date: Fri, 20 Jun 2025 13:43:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.467047
- Title: Prmpt2Adpt: Prompt-Based Zero-Shot Domain Adaptation for Resource-Constrained Environments
- Title(参考訳): Prmpt2Adpt:資源制約環境に対するプロンプトベースのゼロショットドメイン適応
- Authors: Yasir Ali Farrukh, Syed Wali, Irfan Khan, Nathaniel D. Bastian,
- Abstract要約: 教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、現実世界の視覚システム、特にドローンのようなリソース制約のある環境において重要な課題である。
我々はPrmpt2Adptを提案する。Prmpt2Adptはプロンプトベースの機能アライメントによって指導される教師-学生パラダイムを中心に構築されたフレームワークである。
MDS-Aデータセットの実験では、Prmpt2Adptは最先端の手法と比較して競合検出性能を達成している。
- 参考スコア(独自算出の注目度): 5.298018090482744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised Domain Adaptation (UDA) is a critical challenge in real-world vision systems, especially in resource-constrained environments like drones, where memory and computation are limited. Existing prompt-driven UDA methods typically rely on large vision-language models and require full access to source-domain data during adaptation, limiting their applicability. In this work, we propose Prmpt2Adpt, a lightweight and efficient zero-shot domain adaptation framework built around a teacher-student paradigm guided by prompt-based feature alignment. At the core of our method is a distilled and fine-tuned CLIP model, used as the frozen backbone of a Faster R-CNN teacher. A small set of low-level source features is aligned to the target domain semantics-specified only through a natural language prompt-via Prompt-driven Instance Normalization (PIN). These semantically steered features are used to briefly fine-tune the detection head of the teacher model. The adapted teacher then generates high-quality pseudo-labels, which guide the on-the-fly adaptation of a compact student model. Experiments on the MDS-A dataset demonstrate that Prmpt2Adpt achieves competitive detection performance compared to state-of-the-art methods, while delivering up to 7x faster adaptation and 5x faster inference speed using few source images-making it a practical and scalable solution for real-time adaptation in low-resource domains.
- Abstract(参考訳): 教師なしドメイン適応(Unsupervised Domain Adaptation, UDA)は、特にメモリと計算が制限されたドローンのようなリソース制約の環境において、現実世界の視覚システムにおいて重要な課題である。
既存のプロンプト駆動型UDAメソッドは一般的に大きなビジョン言語モデルに依存し、適応中にソースドメインデータへの完全なアクセスを必要とし、適用性を制限する。
本研究では,Prmpt2Adptを提案する。Prmpt2Adptは,プロンプトベースの特徴アライメントによって指導される教師-学生パラダイムを中心に構築された,軽量で効率的なゼロショットドメイン適応フレームワークである。
提案手法のコアとなるのは,より高速なR-CNN教師の冷凍バックボーンとして使用される蒸留・微調整CLIPモデルである。
PIN(Prompt-driven Instance Normalization)は、PIN(Prompt-driven Instance Normalization)を経由する自然言語プロンプトを通じてのみ、ターゲットドメインのセマンティクスを指定する。
これらの意味論的ステアリングされた特徴は、教師モデルの検出ヘッドを短時間微調整するために使用される。
適応された教師は、高品質な擬似ラベルを生成し、コンパクトな学生モデルのオンザフライ適応を導く。
MDS-Aデータセットの実験では、Prmpt2Adptは最先端の手法と比較して競合検出性能が向上する一方で、ソースイメージが少ないため、最大7倍高速な適応と5倍高速な推論速度を実現している。
関連論文リスト
- Source-Free Domain Adaptation for YOLO Object Detection [12.998403995812298]
本稿では、現実世界の視覚システム、特に単発検出器のYOLOファミリーに対するドメイン適応技術に焦点を当てる。
提案手法は,教師が学習対象の領域に固有の拡張を施した画像を受け取るためのフレームワークである。
ラベルのない平均教師アーキテクチャを用いた自己学習の課題は、ノイズやドリフトする擬似ラベルによる精度の急激な低下である。
論文 参考訳(メタデータ) (2024-09-25T01:22:10Z) - Decorate the Newcomers: Visual Domain Prompt for Continual Test Time
Adaptation [14.473807945791132]
Continual Test-Time Adaptation (CTTA) は、ソースデータにアクセスすることなく、ラベルなしのターゲットドメインを継続的に変更することを目的としている。
そこで本論文では,NLPにおける素早い学習によって動機づけられた画像レベルの視覚領域プロンプトを,ソースモデルパラメータを凍結させながら学習することを提案する。
論文 参考訳(メタデータ) (2022-12-08T08:56:02Z) - P{\O}DA: Prompt-driven Zero-shot Domain Adaptation [27.524962843495366]
我々は,対象領域の自然言語,すなわちプロンプトの一般的な記述のみを用いて,ソースドメイン上で訓練されたモデルを適用する。
本稿では,これらのプロンプト駆動による拡張が,セマンティックセグメンテーションのためのゼロショットドメイン適応の実行に有効であることを示す。
論文 参考訳(メタデータ) (2022-12-06T18:59:58Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Multi-Prompt Alignment for Multi-Source Unsupervised Domain Adaptation [86.02485817444216]
マルチプロンプトアライメント(MPA: Multi-Prompt Alignment)は,マルチソースUDAのためのシンプルかつ効率的なフレームワークである。
MPAは、学習したプロンプトを自動エンコードプロセスで認知し、再構築されたプロンプトの合意を最大化することでそれらを調整する。
実験によると、MPAは3つの一般的なデータセットで最先端の結果を達成し、DomainNetの平均精度は54.1%である。
論文 参考訳(メタデータ) (2022-09-30T03:40:10Z) - Domain Adaptation via Prompt Learning [39.97105851723885]
Unsupervised Domain Adaption (UDA) は、十分にアノテーションされたソースドメインから学習したモデルをターゲットドメインに適応させることを目的としている。
我々は,Prompt Learning (DAPL) によるドメイン適応という,UDAのための新しいプロンプト学習パラダイムを導入する。
論文 参考訳(メタデータ) (2022-02-14T13:25:46Z) - On Universal Black-Box Domain Adaptation [53.7611757926922]
実践的な展開という観点から,ドメイン適応の最小限の制約条件について検討する。
ソースモデルのインターフェースのみがターゲットドメインで利用可能であり、2つのドメイン間のラベル空間関係が異なることや未知であることが許されている。
対象試料の局所近傍における予測の整合性によって正規化された自己訓練フレームワークに統一することを提案する。
論文 参考訳(メタデータ) (2021-04-10T02:21:09Z) - Adaptive Risk Minimization: Learning to Adapt to Domain Shift [109.87561509436016]
ほとんどの機械学習アルゴリズムの基本的な前提は、トレーニングとテストデータは、同じ基礎となる分布から引き出されることである。
本研究では,学習データをドメインに構造化し,複数のテスト時間シフトが存在する場合の領域一般化の問題点について考察する。
本稿では、適応リスク最小化(ARM)の枠組みを紹介し、モデルがトレーニング領域に適応することを学ぶことで、効果的な適応のために直接最適化される。
論文 参考訳(メタデータ) (2020-07-06T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。