論文の概要: AREA: Attribute Extraction and Aggregation for CLIP-Based Class-Incremental Learning
- arxiv url: http://arxiv.org/abs/2605.28809v1
- Date: Wed, 27 May 2026 17:58:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.265218
- Title: AREA: Attribute Extraction and Aggregation for CLIP-Based Class-Incremental Learning
- Title(参考訳): AREA:CLIPに基づくクラスインクリメンタル学習のための属性抽出と集約
- Authors: Zhen-Hao Xie, Yu-Cheng Shi, Da-Wei Zhou,
- Abstract要約: CIL(Class-Incremental Learning)は,現実世界の学習システム構築において重要である。
CLIにおける属性抽出とアグリゲーションのためのAREAを提案する。
実験の結果、AREAはSOTA法よりも一貫して優れていた。
- 参考スコア(独自算出の注目度): 17.715024506546957
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Class-Incremental Learning (CIL) is important in building real-world learning systems. In CLIP-based CIL, the model performs classification by comparing similarity between visual and textual embeddings obtained from template prompts, e.g., ``a photo of a [CLASS]''. This seemingly monolithic matching process can be decomposed into two conceptually distinct stages: attribute extraction and attribute aggregation. For example, a model may recognize cat using attributes such as fur texture and whiskers. When learning a new class like car, the model must extract additional attributes like wheels and adjust how they are aggregated in the shared representation space. However, since only data from the current task is available, incremental updates can bias both attribute extraction and aggregation toward new classes, leading to catastrophic forgetting. Therefore, we propose AREA for attribute extraction and aggregation in CLIP-based CIL. To stabilize extraction, we anchor class-level visual and textual attributes on the hyperspherical embedding space via principal geodesic analysis. To stabilize aggregation, we learn lightweight task-specific experts with scoring and residual refinement, regularized by a variational information bottleneck objective. During inference, we perform routing over task attribute manifolds via optimal transport for more concise prediction. Experiments show that AREA consistently outperforms SOTA methods. Code is available at https://github.com/LAMDA-CL/ICML2026-AREA.
- Abstract(参考訳): CIL(Class-Incremental Learning)は,現実世界の学習システム構築において重要である。
CLIPベースのCILでは、テンプレートプロンプトから得られる視覚とテキストの埋め込みの類似性(例えば、[CLASS]'の写真)を比較して分類を行う。
この一見モノリシックなマッチングプロセスは、2つの概念的に異なる段階(属性抽出と属性アグリゲーション)に分解することができる。
例えば、モデルが毛皮のテクスチャやウイスキーなどの属性を使って猫を認識できる。
車のような新しいクラスを学ぶとき、モデルは車輪のような追加の属性を抽出し、共有表現空間でどのように集約されるかを調整する必要がある。
しかし、現在のタスクからのデータのみが利用可能であるため、インクリメンタルアップデートは属性抽出とアグリゲーションの両方を新しいクラスに偏らせる可能性があるため、破滅的な忘れがちになる。
そこで我々は,CLIPに基づくCILにおける属性抽出とアグリゲーションのためのAREAを提案する。
抽出を安定させるために,主測地学的解析により,超球面埋め込み空間にクラスレベルの視覚的およびテキスト的属性を固定する。
集約を安定させるために、情報ボトルネックの変動によって正規化され、スコアリングと残差改善により、軽量なタスク固有の専門家を学習する。
推論中、より簡潔な予測のために最適な輸送によってタスク属性多様体上のルーティングを実行する。
実験の結果、AREAはSOTA法よりも一貫して優れていた。
コードはhttps://github.com/LAMDA-CL/ICML2026-AREAで入手できる。
関連論文リスト
- Learning Unified Distance Metric for Heterogeneous Attribute Data Clustering [60.05209293008078]
クラスタ分析のための異種属性再構成と表現(HARR)学習パラダイム
HarR はパラメータフリーで収束保証され、異なる要求されたクラスタ数 $k$ に対してより効果的に自己適応することができる。
論文 参考訳(メタデータ) (2026-03-03T08:13:16Z) - Long-Tailed Classification Based on Coarse-Grained Leading Forest and Multi-Center Loss [20.10399273585125]
Long-tailed (LT) 分類は、現実世界では避けられない問題であり、困難な問題である。
不変特徴学習を用いて多粒度分類モデルを構築することを目的とした,新しい長鎖分類フレームワークを提案する。
提案手法は既存のベンチマークである ImageNet-GLT と MSCOCO-GLT の両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-12T10:51:23Z) - Hierarchical Visual Primitive Experts for Compositional Zero-Shot
Learning [52.506434446439776]
合成ゼロショット学習(CZSL)は、既知のプリミティブ(属性とオブジェクト)の事前知識で構成を認識することを目的としている。
このような問題に対処するために,コンポジショントランスフォーマー(CoT)と呼ばれるシンプルでスケーラブルなフレームワークを提案する。
提案手法は,MIT-States,C-GQA,VAW-CZSLなど,いくつかのベンチマークでSoTA性能を実現する。
論文 参考訳(メタデータ) (2023-08-08T03:24:21Z) - AttriCLIP: A Non-Incremental Learner for Incremental Knowledge Learning [53.32576252950481]
連続学習は、モデルが逐次到着したデータから段階的に知識を学習できるようにすることを目的としている。
本稿では,新しいクラスやタスクの知識を段階的に抽出する,AttriCLIPという非インクリメンタル学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-19T07:39:17Z) - Attribute Propagation Network for Graph Zero-shot Learning [57.68486382473194]
属性伝達ネットワーク (APNet) を導入し, 1) クラス毎に属性ベクトルを生成するグラフ伝搬モデルと, 2) パラメータ化隣人 (NN) 分類器から構成する。
APNetは、2つのゼロショット学習設定と5つのベンチマークデータセットによる実験で、魅力的なパフォーマンスまたは新しい最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-24T16:53:40Z) - Learning Class Regularized Features for Action Recognition [68.90994813947405]
本稿では,階層活性化のクラスベース正規化を行うクラス正規化手法を提案する。
動作認識に最先端CNNアーキテクチャのクラス正規化ブロックを用いることで,Kineetics,UCF-101,HMDB-51データセットにおいて,それぞれ1.8%,1.2%,1.4%の体系的改善が得られた。
論文 参考訳(メタデータ) (2020-02-07T07:27:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。