論文の概要: Revisiting Pool-based Prompt Learning for Few-shot Class-incremental Learning
- arxiv url: http://arxiv.org/abs/2507.09183v2
- Date: Sun, 20 Jul 2025 03:01:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 12:28:43.117489
- Title: Revisiting Pool-based Prompt Learning for Few-shot Class-incremental Learning
- Title(参考訳): 授業増分学習のためのプール型プロンプト学習の再検討
- Authors: Yongwei Jiang, Yixiong Zou, Yuhua Li, Ruixuan Li,
- Abstract要約: FSCIL(Few-Shot Class-Incremental Learning)は、データの不足と漸進的な学習という2つの課題に直面している。
本稿では、FSCILタスクにおける現在のプロンプトプール方式に関する最初の研究を行い、インクリメンタルセッションにおける予期せぬ性能劣化を明らかにした。
本稿では,プールベースの素早い学習をトークン次元から空間次元に革新的にシフトさせるLGSP-Promptを提案する。
- 参考スコア(独自算出の注目度): 9.365590675168589
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-Shot Class-Incremental Learning (FSCIL) faces dual challenges of data scarcity and incremental learning in real-world scenarios. While pool-based prompting methods have demonstrated success in traditional incremental learning, their effectiveness in FSCIL settings remains unexplored. This paper presents the first study of current prompt pool methods in FSCIL tasks, revealing an unanticipated performance degradation in incremental sessions. Through comprehensive analysis, we identify that this phenomenon stems from token-dimension saturation: with limited data, excessive prompts compete for task-relevant information, leading to model overfitting. Based on this finding, we propose LGSP-Prompt (Local-Global Spatial Prompting), which innovatively shifts pool-based prompt learning from the token dimension to the spatial dimension. LGSP-Prompt generates spatial prompts by synergistically combining local spatial features and global frequency-domain representations to highlight key patterns in input images. We construct two spatial prompt pools enabling dynamic prompt selection to maintain acquired knowledge while effectively learning novel sessions. Extensive experiments demonstrate that our approach achieves state-of-the-art performance across multiple FSCIL benchmarks, showing significant advantages in both base knowledge preservation and incremental learning. Our implementation is available at https://github.com/Jywsuperman/LGSP.
- Abstract(参考訳): FSCIL(Few-Shot Class-Incremental Learning)は、実世界のシナリオにおいて、データの不足と漸進的な学習という2つの課題に直面している。
プールベースのプロンプト手法は従来の漸進的な学習に成功しているが、FSCIL設定の有効性は未解明のままである。
本稿では、FSCILタスクにおける現在のプロンプトプール方式に関する最初の研究を行い、インクリメンタルセッションにおける予期せぬ性能劣化を明らかにした。
包括的分析により、この現象はトークン次元の飽和が原因であり、限られたデータで過剰なプロンプトがタスク関連情報と競合し、モデルオーバーフィッティングにつながる。
そこで本研究では, プール型プロンプト学習をトークン次元から空間次元へ革新的にシフトさせるLGSP-Prompt (Local-Global Space Prompting)を提案する。
LGSP-Promptは、局所的な空間特徴と大域的な周波数領域表現を相乗的に組み合わせて、入力画像のキーパターンをハイライトすることで空間的プロンプトを生成する。
我々は,新しいセッションを効果的に学習しながら,獲得した知識を動的に選択できる2つの空間的プロンプトプールを構築した。
大規模な実験により,本手法は複数のFSCILベンチマークにまたがる最先端性能を実現し,基礎知識の保存と漸進学習の両面で大きな優位性を示した。
私たちの実装はhttps://github.com/Jywsuperman/LGSP.comで公開されています。
関連論文リスト
- An Empirical Study of Federated Prompt Learning for Vision Language Model [50.73746120012352]
本稿では,言語素性学習と視覚素性学習の行動的差異を系統的に検討する。
クライアントスケールやアグリゲーション戦略,プロンプト長といった,さまざまなflの影響評価実験を行う。
ラベルスキューとドメインシフトが共存する複雑なシナリオにおいて、迅速な学習を促進するための戦略を検討する。
論文 参考訳(メタデータ) (2025-05-29T03:09:15Z) - FDBPL: Faster Distillation-Based Prompt Learning for Region-Aware Vision-Language Models Adaptation [17.51747913191231]
大規模なtextbfFaster large textbfDistillation-large textbfBased large textbfPrompt large textbfLL (textbfFDBPL) を提案する。
複数のトレーニングステージにまたがってソフトな監視コンテキストを共有し、アクセラレーションされたI/Oを実装することで、問題に対処する。11データセットにわたる包括的な評価は、ベース・ツー・ニューな一般化、クロス・データセットの転送、ロバストネステストにおいて優れたパフォーマンスを示し、より高速なトレーニング速度で2.2倍の速さで達成する。
論文 参考訳(メタデータ) (2025-05-23T15:57:16Z) - ReGUIDE: Data Efficient GUI Grounding via Spatial Reasoning and Search [53.40810298627443]
ReGUIDEは、MLLMが自己生成的推論と空間認識的批判を通じてデータを効率的に学習することを可能にするWebグラウンドのためのフレームワークである。
実験により、ReGUIDEは複数のベンチマークでWebグラウンド性能を大幅に向上することが示された。
論文 参考訳(メタデータ) (2025-05-21T08:36:18Z) - SiameseDuo++: Active Learning from Data Streams with Dual Augmented Siamese Networks [8.762175520727611]
この研究は、アクティブラーニングを使用して、予算に応じてラベル付けする人間のエキスパートのインスタンスを自動的に選択する、SiameseDuo++メソッドを提案する。
具体的には、シナジーで動作し、生成された例によって強化される2つのシアムニューラルネットワークをインクリメンタルにトレーニングする。
シミュレーション実験により,提案手法は学習速度および/または性能の点で,強いベースラインと最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-04-06T20:45:25Z) - Underlying Semantic Diffusion for Effective and Efficient In-Context Learning [113.4003355229632]
Underlying Semantic Diffusion (US-Diffusion)は、セマンティック学習、計算効率、文脈内学習能力を高める拡張拡散モデルである。
本稿では,フィードバック信号を利用したフィードバック支援学習(FAL)フレームワークを提案する。
また,高雑音レベルの時間ステップで高密度サンプリングを行うためのプラグイン・アンド・プレイの効率的なサンプリング戦略(ESS)を提案する。
論文 参考訳(メタデータ) (2025-03-06T03:06:22Z) - USDRL: Unified Skeleton-Based Dense Representation Learning with Multi-Grained Feature Decorrelation [24.90512145836643]
本稿では,特徴デコレーションに基づく統一骨格に基づくDense Representation Learningフレームワークを提案する。
我々のアプローチは現在のSOTA(State-of-the-art)アプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-12-12T12:20:27Z) - LW2G: Learning Whether to Grow for Prompt-based Continual Learning [55.552510632228326]
最近のPromptベースの連続学習は、事前訓練されたモデルで顕著な性能を達成した。
これらのアプローチは、学習中に新しいプロンプトセットを追加してプロンプトプールを拡張し、推論中に正しいセットを選択する。
従来,PCLの性能向上に課題を呈する課題として,タスク指向のプロンプトセットの個別化と選択精度の低さが指摘されてきた。
論文 参考訳(メタデータ) (2024-09-27T15:55:13Z) - Conditional Prototype Rectification Prompt Learning [32.533844163120875]
本稿では, 基本事例のバイアスを補正し, 限られたデータを効果的に拡張するための, CPR(Prototype Rectification Prompt Learning)手法を提案する。
CPRは、いくつかのショット分類とベース・ツー・ニューな一般化タスクの両方において最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-04-15T15:43:52Z) - PL-FSCIL: Harnessing the Power of Prompts for Few-Shot Class-Incremental Learning [9.247718160705512]
FSCIL(Few-Shot Class-Incremental Learning)は、ディープニューラルネットワークが少数のラベル付きサンプルから段階的に新しいタスクを学習できるようにすることを目的としている。
FSCIL(PL-FSCIL)のためのPrompt Learningと呼ばれる新しいアプローチを提案する。
PL-FSCILは、FSCILの課題に効果的に取り組むために、事前訓練されたビジョントランスフォーマー(ViT)モデルと共にプロンプトのパワーを利用する。
論文 参考訳(メタデータ) (2024-01-26T12:11:04Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Incremental Embedding Learning via Zero-Shot Translation [65.94349068508863]
現在の最先端のインクリメンタル学習手法は、従来の分類ネットワークにおける破滅的な忘れ方問題に取り組む。
ゼロショット変換クラス増分法(ZSTCI)と呼ばれる新しい組込みネットワークのクラス増分法を提案する。
さらに、ZSTCIを既存の正規化ベースのインクリメンタル学習手法と組み合わせることで、組み込みネットワークの性能をより向上させることができる。
論文 参考訳(メタデータ) (2020-12-31T08:21:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。