Fugu-MT 論文翻訳(概要): Enhancing Visual Continual Learning with Language-Guided Supervision

論文の概要: Enhancing Visual Continual Learning with Language-Guided Supervision

arxiv url: http://arxiv.org/abs/2403.16124v1
Date: Sun, 24 Mar 2024 12:41:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-26 17:25:57.760614
Title: Enhancing Visual Continual Learning with Language-Guided Supervision
Title（参考訳）: 言語誘導型スーパービジョンによる視覚連続学習の強化
Authors: Bolin Ni, Hongbo Zhao, Chenghao Zhang, Ke Hu, Gaofeng Meng, Zhaoxiang Zhang, Shiming Xiang,
Abstract要約: 継続的な学習は、モデルが以前獲得した知識を忘れずに新しいタスクを学習できるようにすることを目的としている。ワンホットラベルが伝達する少ない意味情報は,タスク間の効果的な知識伝達を妨げている,と我々は主張する。具体的には, PLM を用いて各クラスのセマンティックターゲットを生成し, 凍結し, 監視信号として機能する。
参考スコア（独自算出の注目度）: 76.38481740848434
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Continual learning (CL) aims to empower models to learn new tasks without forgetting previously acquired knowledge. Most prior works concentrate on the techniques of architectures, replay data, regularization, \etc. However, the category name of each class is largely neglected. Existing methods commonly utilize the one-hot labels and randomly initialize the classifier head. We argue that the scarce semantic information conveyed by the one-hot labels hampers the effective knowledge transfer across tasks. In this paper, we revisit the role of the classifier head within the CL paradigm and replace the classifier with semantic knowledge from pretrained language models (PLMs). Specifically, we use PLMs to generate semantic targets for each class, which are frozen and serve as supervision signals during training. Such targets fully consider the semantic correlation between all classes across tasks. Empirical studies show that our approach mitigates forgetting by alleviating representation drifting and facilitating knowledge transfer across tasks. The proposed method is simple to implement and can seamlessly be plugged into existing methods with negligible adjustments. Extensive experiments based on eleven mainstream baselines demonstrate the effectiveness and generalizability of our approach to various protocols. For example, under the class-incremental learning setting on ImageNet-100, our method significantly improves the Top-1 accuracy by 3.2\% to 6.1\% while reducing the forgetting rate by 2.6\% to 13.1\%.
Abstract（参考訳）: 継続学習(CL)は、モデルが以前獲得した知識を忘れずに新しいタスクを学習できるようにすることを目的としている。それまでの作業のほとんどは、アーキテクチャのテクニック、データ再生、正規化、および \etcに重点を置いていた。しかし、各クラスの分類名は概ね無視されている。既存の手法では1ホットラベルを使い、ランダムにクラシファイアヘッドを初期化する。ワンホットラベルが伝達する少ない意味情報は,タスク間の効果的な知識伝達を妨げている,と我々は主張する。本稿では,CLパラダイムにおけるクラシファイアヘッドの役割を再考し,事前学習された言語モデル(PLM)からのセマンティック知識で分類器を置き換える。具体的には, PLM を用いて各クラスのセマンティックターゲットを生成し, 凍結し, 訓練中の監視信号として機能する。そのようなターゲットはタスク間のすべてのクラス間の意味的相関を完全に考慮する。実証実験により,本手法は,タスク間の知識伝達を緩和し,表現の漂流を緩和することにより,忘れを緩和することを示した。提案手法は実装が簡単で,既存の手法にシームレスにプラグインできる。 11の主流ベースラインに基づく大規模な実験は、様々なプロトコルに対する我々のアプローチの有効性と一般化性を実証する。例えば、ImageNet-100のクラスインクリメンタル・ラーニング・セッティングにおいて、この手法はTop-1の精度を3.2\%から6.1\%に大幅に改善し、忘れる確率を2.6\%から13.1\%に下げる。

関連論文リスト

EMPL: A novel Efficient Meta Prompt Learning Framework for Few-shot Unsupervised Domain Adaptation [22.586094394391747]
本稿では,FS-UDAのためのメタプロンプト学習フレームワークを提案する。このフレームワークでは、事前訓練されたCLIPモデルを機能学習ベースモデルとして使用しています。 5-way 1-shotでは少なくとも15.4%,5-way 5-shotでは8.7%の大幅な改善が得られた。
論文参考訳（メタデータ） (2024-07-04T17:13:06Z)
Improving Zero-shot Generalization of Learned Prompts via Unsupervised Knowledge Distillation [14.225723195634941]
より強力なモデルからの教師なし知識の蒸留に基づく学習を促す新しい手法を提案する。我々はKDPL(Knowledge Distillation Prompt Learning)と呼ぶアプローチを,既存の即興学習技術に統合することができる。
論文参考訳（メタデータ） (2024-07-03T12:24:40Z)
Adaptive Rentention & Correction for Continual Learning [114.5656325514408]
連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。 ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文参考訳（メタデータ） (2024-05-23T08:43:09Z)
Semantic Segmentation with Active Semi-Supervised Representation Learning [23.79742108127707]
我々はラベル付きデータよりもはるかに少ない効果的なセマンティックセグメンテーションアルゴリズムを訓練する。半教師あり学習のための平均教師アプローチを自己学習アプローチに置き換えることで、従来のS4ALアルゴリズムを拡張した。セマンティックセグメンテーションのためのアクティブラーニングのためのデファクト標準であるCamVidおよびCityScapesデータセットについて,本手法の評価を行った。
論文参考訳（メタデータ） (2022-10-16T00:21:43Z)
Few-Shot Incremental Learning with Continually Evolved Classifiers [46.278573301326276]
Few-shot Class-Incremental Learning(FSCIL)は、いくつかのデータポイントから新しい概念を継続的に学習できる機械学習アルゴリズムの設計を目指している。難点は、新しいクラスからの限られたデータが、重大な過度な問題を引き起こすだけでなく、破滅的な忘れの問題も悪化させることにある。我々は,適応のための分類器間のコンテキスト情報を伝達するグラフモデルを用いた連続進化型cif(cec)を提案する。
論文参考訳（メタデータ） (2021-04-07T10:54:51Z)
Partial Is Better Than All: Revisiting Fine-tuning Strategy for Few-shot Learning [76.98364915566292]
一般的なプラクティスは、まずベースセット上でモデルをトレーニングし、その後、微調整によって新しいクラスに移行することである。本稿では,基本モデル内の特定の層を凍結あるいは微調整することにより,部分的知識の伝達を提案する。提案手法の有効性を実証するために, CUB と mini-ImageNet の広範な実験を行った。
論文参考訳（メタデータ） (2021-02-08T03:27:05Z)
ProtoDA: Efficient Transfer Learning for Few-Shot Intent Classification [21.933876113300897]
我々は,メタラーニングパラダイムの下で,原型ネットワークを用いた関連するタスクのアンサンブル上での伝達学習による代替的アプローチを採用する。本研究は,意図分類を事例として,学習課題における多様性の増大が,分類性能を著しく向上させることを示した。
論文参考訳（メタデータ） (2021-01-28T00:19:13Z)
CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action Recognition [52.66360172784038]
各インスタンスを個別に最適化するのではなく,すべてのトレーニングサンプルを同時に考慮したクラスタリングモデルを提案する。提案手法をCLASTERと呼び,すべての標準データセットの最先端性を常に改善することを確認する。
論文参考訳（メタデータ） (2021-01-18T12:46:24Z)
Incremental Embedding Learning via Zero-Shot Translation [65.94349068508863]
現在の最先端のインクリメンタル学習手法は、従来の分類ネットワークにおける破滅的な忘れ方問題に取り組む。ゼロショット変換クラス増分法(ZSTCI)と呼ばれる新しい組込みネットワークのクラス増分法を提案する。さらに、ZSTCIを既存の正規化ベースのインクリメンタル学習手法と組み合わせることで、組み込みネットワークの性能をより向上させることができる。
論文参考訳（メタデータ） (2020-12-31T08:21:37Z)
Boosting the Performance of Semi-Supervised Learning with Unsupervised Clustering [10.033658645311188]
学習中の間欠的にラベルを完全に無視することは,小サンプル体制における性能を著しく向上させることを示す。本手法は,最先端のSSLアルゴリズムの高速化に有効であることを示す。
論文参考訳（メタデータ） (2020-12-01T14:19:14Z)
iTAML: An Incremental Task-Agnostic Meta-learning Approach [123.10294801296926]
人間は経験が成長するにつれて、新しい知識を継続的に学ぶことができる。ディープニューラルネットワークにおける以前の学習は、新しいタスクでトレーニングされたときにすぐに消えてしまう可能性がある。遭遇した全てのタスク間の平衡を維持するために,新しいメタラーニング手法を導入する。
論文参考訳（メタデータ） (2020-03-25T21:42:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。