論文の概要: Concept-Constrained Prompt Learning for Few-Shot CLIP Adaptation
- arxiv url: http://arxiv.org/abs/2606.22567v1
- Date: Sun, 21 Jun 2026 16:09:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 17:33:08.881589
- Title: Concept-Constrained Prompt Learning for Few-Shot CLIP Adaptation
- Title(参考訳): Few-Shot CLIP適応のための概念制約付きプロンプト学習
- Authors: Na Sang, Ding Ma, Rui Sang, Yuxuan Liu,
- Abstract要約: Concept-Constrained Prompt Learning (CCPL)は、学習可能なクラスプロンプトをフリーズしたコンセプトレベルのテキストプロトタイプにアンカーする軽量な正規化フレームワークである。
CCPLは共有コンテキストトークンの集合を学習し、クラス名を追加することでクラスプロンプトをインスタンス化し、クラスレベルのコンセプトバンクからフリーズされたコンセプトプロトタイプを構築する。
- 参考スコア(独自算出の注目度): 6.76303804822749
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot prompt learning is an effective strategy for adapting CLIP to downstream tasks, but class-only prompt optimization can overfit base-class supervision and weaken transfer to unseen classes. We propose Concept-Constrained Prompt Learning (CCPL), a lightweight regularization framework that anchors learnable class prompts to frozen concept-level text prototypes without updating CLIP encoders. CCPL learns a set of shared context tokens, instantiates class prompts by appending class names, and constructs frozen concept prototypes from a class-level concept bank. During training, a text-space cosine consistency objective aligns learnable class-prompt embeddings with frozen concept prototypes; concept dropout provides additional regularization against over-reliance on fixed concept lists. At inference, CCPL optionally fuses class-prompt logits with concept-prototype logits using a controllable ensemble weight alpha. Our default configuration uses text-space concept regularization lambda = 0.5, concept dropout p = 0.3 and weak concept-guided fusion (alpha = 0.1), with no KL-based prediction consistency term. Experiments under identical automatically-generated fallback splits show that CCPL improves the base-to-new harmonic mean on DTD (+0.6) and EuroSAT (+2.9) compared with CoOp, while remaining near-neutral on OxfordPets (-0.1). Ablations indicate that text-space concept regularization is consistently beneficial, while the best concept-guided inference strength is dataset- and protocol-sensitive. These results suggest concept constraints are most effective when concept prototypes align naturally with dataset semantics, and identify fine-grained categories as a current boundary condition. The code is released at: https://github.com/richael-sang/concept-constrained-prompt-learning.
- Abstract(参考訳): ショットプロンプト学習は、CLIPを下流タスクに適用するための効果的な戦略であるが、クラスのみのプロンプト最適化は、ベースクラスの監督に過度に適合し、目に見えないクラスへの転送を弱める可能性がある。
CLIPエンコーダを更新することなく、学習可能なクラスプロンプトをフリーズした概念レベルのテキストプロトタイプにアンロックする軽量正規化フレームワークであるConcept-Constrained Prompt Learning (CCPL)を提案する。
CCPLは共有コンテキストトークンの集合を学習し、クラス名を追加することでクラスプロンプトをインスタンス化し、クラスレベルのコンセプトバンクからフリーズされたコンセプトプロトタイプを構築する。
トレーニング中、テキストスペースのコサイン整合性(cosine consistency)の目的は、学習可能なクラスプロンプト埋め込みを凍結されたコンセプトプロトタイプと整合させる。
推論時にCCPLは、制御可能なアンサンブルウェイトアルファを使用して、クラスプロンプトロジットを概念プロトタイプロジットと任意に融合する。
デフォルト設定では、テキスト空間の概念正規化 lambda = 0.5、概念ドロップアウト p = 0.3、弱い概念誘導融合(alpha = 0.1)を使用します。
自動生成のフォールバック・スプリットによる実験では、CCPLはDTD (+0.6) とEuroSAT (+2.9) をCoOpと比較し、またオックスフォード・ペッツ (-0.1) では準中性のままである。
アブレーションは、テキスト空間の概念正規化は一貫して有用であり、最高の概念誘導推論強度はデータセットとプロトコルに敏感であることを示している。
これらの結果から, 概念の制約は, 概念のプロトタイプがデータセットのセマンティクスと自然に一致する場合に最も効果的であることが示唆された。
コードは、https://github.com/richael-sang/concept-constrained-prompt-learningでリリースされている。
関連論文リスト
- Principles of Concept Representation in Sentence Encoders [0.24828140397930876]
文エンコーダは、その潜在空間が対応する意味演算子の低歪み実現を認める場合にのみ、概念をサポートする。
このフレーミングは、現在のエンコーダが成功する場所と、それらが監督に構造的に不一致している場所の両方を予測する。
微調整は、拡張するのではなく、潜在幾何学を再検討する。
そこで我々は,DBpediaのセマンティックギャップベンチマークと修正子ラベル付きデータセットNPパラフレーズスイートの2つの新しい評価結果を発表した。
論文 参考訳(メタデータ) (2026-06-05T07:33:05Z) - SCALE: Semantic- and Confidence-Aware Conditional Variational Autoencoder for Zero-shot Skeleton-based Action Recognition [4.853241666510524]
ゼロショットスケルトンに基づくアクション認識(ZSAR)は、これらのクラスからのトレーニングスケルトンなしでアクションクラスを認識することを目的としている。
本稿では,ZSARをクラス条件エネルギーランキングとして定式化する,軽量で決定論的セマンティックなセマンティック・アンド・信頼を意識したエネルギーベースフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-02T16:12:42Z) - Explaining CLIP Zero-shot Predictions Through Concepts [54.05282304471016]
EZPCを導入し,CLIPのゼロショット予測を人間に理解可能な概念で説明する。
本手法は,言語記述から学習した概念空間にCLIPの合同画像テキスト埋め込みを投影する。
提案手法は,CLIPの強いゼロショット分類精度を維持しつつ,意味のある概念レベルの説明を提供する。
論文 参考訳(メタデータ) (2026-03-30T09:31:33Z) - Beyond Heuristic Prompting: A Concept-Guided Bayesian Framework for Zero-Shot Image Recognition [81.2779530670268]
VLM(Vision-Language Models)は、ゼロショット画像認識を著しく進歩させたモデルである。
本稿では、クラス固有の概念を取り入れることで、プロンプトを強化する。
我々の手法は一貫して最先端の手法より優れている。
論文 参考訳(メタデータ) (2026-03-09T03:11:11Z) - CORE: Concept-Oriented Reinforcement for Bridging the Definition-Application Gap in Mathematical Reasoning [11.332501212320194]
大規模言語モデル(LLM)は、しばしば挑戦的な数学演習を解くが、真に理解を必要とする場合、その概念を正しく適用できない。
明示的な概念を制御可能な監視信号に変換するRLトレーニングフレームワークであるCORE(Concept-Oriented Reinforcement)を紹介する。
論文 参考訳(メタデータ) (2025-12-21T19:01:35Z) - Cooperative Pseudo Labeling for Unsupervised Federated Classification [62.9387841396335]
Unsupervised Federated Learning (UFL)は、データを共有したりラベル情報にアクセスしたりすることなく、分散クライアント間でグローバルモデルを協調的にトレーニングすることを目的としている。
我々は、新しい方法、 underlinetextbfFederated underlinetextbfCooperative underlinetextbfPseudo underlinetextbfLabeling (textbfFedCoPL)を提案する。
特に、一般的な画像特徴を含む視覚的プロンプトをサーバに集約し、パーソナライズされた知識をコードするテキストプロンプトをローカルに保持する。
論文 参考訳(メタデータ) (2025-10-11T08:18:26Z) - Interpretable Zero-shot Learning with Infinite Class Concepts [34.74107784017915]
本稿では,ゼロショット学習(ZSL)におけるクラスセマンティクスを再定義する。
無限クラス概念を用いたゼロショット学習(InfZSL)という新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2025-05-06T09:30:30Z) - Attribute-formed Class-specific Concept Space: Endowing Language Bottleneck Model with Better Interpretability and Scalability [54.420663939897686]
本稿では,解釈可能な画像認識を実現するために,Attribute-formed Language Bottleneck Model (ALBM)を提案する。
ALBMは属性形式クラス固有の空間において概念を整理する。
解釈性をさらに向上するため,細粒度属性の視覚的特徴を抽出するVAPL(Visual Attribute Prompt Learning)を提案する。
論文 参考訳(メタデータ) (2025-03-26T07:59:04Z) - Discover-then-Name: Task-Agnostic Concept Bottlenecks via Automated Concept Discovery [52.498055901649025]
ディープニューラルネットワークの「ブラックボックス」問題に対処するために、概念ボトルネックモデル(CBM)が提案されている。
本稿では,典型的なパラダイムを逆転させる新しいCBMアプローチであるDiscover-then-Name-CBM(DN-CBM)を提案する。
我々の概念抽出戦略は、下流のタスクに非依存であり、既にそのモデルに知られている概念を使用するため、効率的である。
論文 参考訳(メタデータ) (2024-07-19T17:50:11Z) - Sparse Concept Bottleneck Models: Gumbel Tricks in Contrastive Learning [86.15009879251386]
概念ボトルネックモデル(CBM)を用いた新しいアーキテクチャと説明可能な分類法を提案する。
CBMには、さらなる概念のセットが必要である。
CLIPをベースとしたボトルネックモデルにおいて,スパース隠れ層を用いた精度の大幅な向上を示す。
論文 参考訳(メタデータ) (2024-04-04T09:43:43Z) - Medical Concept Normalization in User Generated Texts by Learning Target
Concept Embeddings [5.33024001730262]
最近の研究は、テキスト分類またはテキストマッチングとして、正規化の概念を定めている。
提案モデルでは,入力概念の参照とターゲット概念の表現を共同で学習することで,これらの欠点を克服する。
我々のモデルは、精度を2.31%向上させることで、3つの標準データセットにまたがる既存のメソッドをすべて上回ります。
論文 参考訳(メタデータ) (2020-06-07T01:17:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。