論文の概要: ProTPS: Prototype-Guided Text Prompt Selection for Continual Learning
- arxiv url: http://arxiv.org/abs/2604.01116v1
- Date: Wed, 01 Apr 2026 16:39:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:32.093767
- Title: ProTPS: Prototype-Guided Text Prompt Selection for Continual Learning
- Title(参考訳): ProTPS: 連続学習のためのプロトタイプガイド付きテキストプロンプト選択
- Authors: Jie Mei, Li-Leng Peng, Keith Fuller, Jenq-Neng Hwang,
- Abstract要約: 本稿では,Prototype-Guided Text Prompt Selection (ProTPS)' を提案する。
ProTPSはクラス固有の視覚プロトタイプと各クラスのテキストプロンプトを学習します。
ProTPSは上界に近い性能を達成するため、112種の海洋生物の実際のデータセットを収集します。
- 参考スコア(独自算出の注目度): 23.68741134810291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For continual learning, text-prompt-based methods leverage text encoders and learnable prompts to encode semantic features for sequentially arrived classes over time. A common challenge encountered by existing works is how to learn unique text prompts, which implicitly carry semantic information of new classes, so that the semantic features of newly arrived classes do not overlap with those of trained classes, thereby mitigating the catastrophic forgetting problem. To address this challenge, we propose a novel approach Prototype-guided Text Prompt Selection (ProTPS)'' to intentionally increase the training flexibility thus encouraging the learning of unique text prompts. Specifically, our ProTPS learns class-specific vision prototypes and text prompts. Vision prototypes guide the selection and learning of text prompts for each class. We first evaluate our ProTPS in both class incremental (CI) setting and cross-datasets continual (CDC) learning setting. Because our ProTPS achieves performance close to the upper bounds, we further collect a real-world dataset with 112 marine species collected over a span of six years, named Marine112, to bring new challenges to the community. Marine112 is authentically suited for the class and domain incremental (CDI) learning setting and is under natural long-tail distribution. The results under three settings show that our ProTPS performs favorably against the recent state-of-the-art methods. The implementation code and Marine112 dataset will be released upon the acceptance of our paper.
- Abstract(参考訳): 継続学習では、テキストプロンプトベースのメソッドがテキストエンコーダと学習可能なプロンプトを利用して、逐次到着したクラスのセマンティック機能をエンコードする。
既存の研究でよく見られる課題は、新しいクラスのセマンティックな情報を暗黙的に持っていくユニークなテキストプロンプトを学習する方法であり、新しく到着したクラスのセマンティックな特徴が訓練されたクラスのものと重複しないため、破滅的な忘れの問題を軽減する。
この課題に対処するために,プロトタイプ誘導型テキストプロンプト選択(ProTPS)' という新しいアプローチを提案し,学習の柔軟性を意図的に向上させ,ユニークなテキストプロンプトの学習を促す。
具体的には、クラス固有の視覚プロトタイプとテキストプロンプトを学習します。
視覚プロトタイプは、各クラスのテキストプロンプトの選択と学習をガイドする。
まず,ProTPSをクラスインクリメンタル(CI)設定とクロスデータセット継続(CDC)学習設定の両方で評価した。
ProTPSは上層部に近い性能を達成するため、海洋生物112種が6年間にわたって収集された実際のデータセットをさらに収集し、コミュニティに新たな課題をもたらします。
Marine112はクラスとドメインインクリメンタル(CDI)の学習環境に適している。
3つの設定で得られた結果から,我々のProTPSは最近の最先端手法に対して良好に機能することが示された。
実装コードとMarine112データセットは、私たちの論文の受理によってリリースされます。
関連論文リスト
- AttriPrompt: Dynamic Prompt Composition Learning for CLIP [41.37140060183439]
AttriPromptは、テキストの意味表現を強化し洗練する新しいフレームワークである。
本稿では,提案するテキスト特徴量と非プロンプトテキスト特徴量の間に明示的な正規化制約を適用することで,自己正規化機構を導入する。
実験では、AttriPromptが最先端の手法よりも優れており、ベース・ツー・ノーベル・セッティングにおいて最大7.37%の改善が達成されている。
論文 参考訳(メタデータ) (2025-09-07T07:07:59Z) - Mixture of Prompt Learning for Vision Language Models [12.828490399811376]
ルーティングモジュールを組み込んだソフトプロンプト学習手法の混合を提案する。
このモジュールはデータセットのさまざまなスタイルをキャプチャし、インスタンス毎に最も適切なプロンプトを動的に選択することができる。
また、意味的にグループ化されたテキストレベルの監視を実装し、各ソフトプロンプトを、そのグループから手動で設計されたテンプレートのトークン埋め込みで初期化する。
論文 参考訳(メタデータ) (2024-09-18T14:25:02Z) - Semantic Residual Prompts for Continual Learning [21.986800282078498]
提案手法は,最先端CLアプローチとゼロショットCLIPテストの両方で有意に優れていた。
我々の発見は、バックボーンモデルの事前学習知識に相当な領域ギャップを持つデータセットにも当てはまる。
論文 参考訳(メタデータ) (2024-03-11T16:23:38Z) - TCP:Textual-based Class-aware Prompt tuning for Visual-Language Model [78.77544632773404]
本稿では,テキストベースのクラス認識型Promptチューニング(TCP)を提案する。
TCPは、トレーニング時間の短縮を要求しながら、常に優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-30T03:59:23Z) - MaPLe: Multi-modal Prompt Learning [54.96069171726668]
本稿では,視覚と言語分岐の両方を対象としたマルチモーダル・プロンプト・ラーニング(MaPLe)を提案し,視覚と言語表現の整合性を改善する。
最先端のCo-CoOpと比較すると、MaPLeは優れた性能を示し、新規クラスでは3.45%の絶対的な向上を達成している。
論文 参考訳(メタデータ) (2022-10-06T17:59:56Z) - LASP: Text-to-Text Optimization for Language-Aware Soft Prompting of
Vision & Language Models [67.19124099815645]
ベースクラスオーバーフィットを軽減するために,Language-Aware Soft Prompting (LASP) 学習手法を提案する。
LASPは本質的に、トレーニング中に仮想クラス、すなわちビジュアルサンプルが使用できないクラス名を含むことができる。
LASPは、手作りのプロンプトとCLIPによる11のテストデータセットのうち8つの新しいクラスの精度が初めて一致し、上回っている。
論文 参考訳(メタデータ) (2022-10-03T17:56:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。