論文の概要: When Adaptation Fails: A Gradient-Based Diagnosis of Collapsed Gating in Vision-Language Prompt Learning
- arxiv url: http://arxiv.org/abs/2605.09549v1
- Date: Sun, 10 May 2026 14:06:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.307745
- Title: When Adaptation Fails: A Gradient-Based Diagnosis of Collapsed Gating in Vision-Language Prompt Learning
- Title(参考訳): 適応が失敗した場合:視覚言語学習における失速の段階的診断
- Authors: Yunxuan Fang, Ziwei Zhang, Xinhe Wang,
- Abstract要約: CLIPスタイルのバックボーンによる凍結された数発のプロンプト学習では、適応ゲートとプロンプト選択モジュールがしばしば崩壊する。
繰り返し発生する障害モードとして,勾配等級不均衡とゲート劣化の2つを同定した。
- 参考スコア(独自算出の注目度): 5.597783017180159
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive prompting mechanisms have been proposed to enhance vision-language models by dynamically tailoring prompts to inputs. However, in frozen few-shot prompt learning with CLIP-style backbones, we systematically observe that adaptive gates and prompt-selection modules often collapse: they produce nearly constant outputs, contribute negligible gradient signals, and frequently fail to outperform fixed prompts. To further explore this issue, we present a systematic diagnostic study to uncover the underlying causes and conditions of adaptation failure. Through controlled experiments across datasets and multiple prompt learning architectures, we identify two recurring failure modes: gradient magnitude imbalance and gate degradation. Our findings invite a re-examination of indiscriminately adding architectural complexity in parameter-efficient learning and clarify when prompt-level adaptive gating is, and is not, effective in this regime.
- Abstract(参考訳): 入力へのプロンプトを動的に調整することで視覚言語モデルを強化する適応的プロンプト機構が提案されている。
しかし,CLIPスタイルのバックボーンを用いた数発のプロンプト学習では,適応ゲートとプロンプト選択モジュールがほぼ一定出力を生成し,無視できる勾配信号に寄与し,固定プロンプトを上回る結果が得られなかったため,適応ゲートとプロンプト選択モジュールがしばしば崩壊することが系統的に観察された。
この問題をさらに探求するため,適応障害の根本原因と状況を明らかにするための系統的診断研究を提案する。
データセット間の制御された実験と複数の素早い学習アーキテクチャにより、勾配等級不均衡とゲート劣化という2つの繰り返し発生する障害モードを同定する。
本研究は,パラメータ効率学習における非差別的なアーキテクチャ的複雑さの再検討を招き,即時適応ゲーティングがいつ,かつ,この体制に有効であるかを明らかにした。
関連論文リスト
- Adaptive Learning Guided by Bias-Noise-Alignment Diagnostics [0.7519872646378835]
本稿では,誤り適応進化を明示的にモデル化する診断駆動学習フレームワークを提案する。
これらの診断は、損失または時間差(TD)誤差軌跡の軽量統計からオンラインで計算される。
論文 参考訳(メタデータ) (2025-12-30T19:57:52Z) - ASK: Adaptive Self-improving Knowledge Framework for Audio Text Retrieval [19.94287753279928]
オーディオテキスト検索(ATR)の主流パラダイムは、ミニバッチベースのコントラスト学習に依存している。
Gradient Locality Bottleneck(GLB)は、モデルがバッチ外の知識を活用することを構造的に防止する。
Representation-Drift Mismatch(Representation-Drift Mismatch、RDM)とは、静的知識ベースが進化するモデルと徐々に不一致になり、ガイダンスがノイズになる現象である。
論文 参考訳(メタデータ) (2025-12-11T14:48:30Z) - Model Hemorrhage and the Robustness Limits of Large Language Models [119.46442117681147]
大規模言語モデル(LLM)は、自然言語処理タスク全体で強力なパフォーマンスを示すが、デプロイメント用に修正された場合、大幅なパフォーマンス低下を経験する。
この現象をモデル出血(パラメータ変更とアーキテクチャ変更によるパフォーマンス低下)と定義する。
論文 参考訳(メタデータ) (2025-03-31T10:16:03Z) - Learning Prompt-Enhanced Context Features for Weakly-Supervised Video
Anomaly Detection [37.99031842449251]
弱い監督下での映像異常検出は重大な課題を呈する。
本稿では,効率的なコンテキストモデリングとセマンティック識別性の向上に焦点をあてた,弱教師付き異常検出フレームワークを提案する。
提案手法は,特定の異常なサブクラスの検出精度を大幅に向上させ,その実用的価値と有効性を裏付けるものである。
論文 参考訳(メタデータ) (2023-06-26T06:45:16Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。