論文の概要: A baseline on continual learning methods for video action recognition
- arxiv url: http://arxiv.org/abs/2304.10335v2
- Date: Wed, 26 Apr 2023 09:49:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-27 17:00:15.132249
- Title: A baseline on continual learning methods for video action recognition
- Title(参考訳): 映像行動認識のための連続学習手法のベースライン
- Authors: Giulia Castagnolo, Concetto Spampinato, Francesco Rundo, Daniela
Giordano, Simone Palazzo
- Abstract要約: 継続学習は、古典的な教師付きモデルの長期的制限を解決することを目的としている。
本稿では,映像行動認識における最先端の連続学習手法のベンチマークを示す。
- 参考スコア(独自算出の注目度): 15.157938674002793
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continual learning has recently attracted attention from the research
community, as it aims to solve long-standing limitations of classic
supervisedly-trained models. However, most research on this subject has tackled
continual learning in simple image classification scenarios. In this paper, we
present a benchmark of state-of-the-art continual learning methods on video
action recognition. Besides the increased complexity due to the temporal
dimension, the video setting imposes stronger requirements on computing
resources for top-performing rehearsal methods. To counteract the increased
memory requirements, we present two method-agnostic variants for rehearsal
methods, exploiting measures of either model confidence or data information to
select memorable samples. Our experiments show that, as expected from the
literature, rehearsal methods outperform other approaches; moreover, the
proposed memory-efficient variants are shown to be effective at retaining a
certain level of performance with a smaller buffer size.
- Abstract(参考訳): 近年,従来の教師付きモデルの長期的限界を解決することを目的として,研究コミュニティから継続的な学習が注目されている。
しかし,本研究のほとんどが,単純な画像分類シナリオにおける連続学習に取り組んできた。
本稿では,映像行動認識における最先端の連続学習手法のベンチマークを示す。
時間次元による複雑さの増加に加えて、ビデオ設定は、トップパーパフォーミングリハーサルメソッドの計算リソースに対するより強い要求を課している。
メモリ要求の増大に対処するため,リハーサル法に2つの方法に依存しない変種を提示し,モデル信頼度とデータ情報を用いて記憶可能なサンプルを選択する。
実験の結果,リハーサル法は他の手法よりも優れていることがわかった。さらに,提案したメモリ効率の変動は,バッファサイズが小さい一定の性能を維持するのに有効であることがわかった。
関連論文リスト
- Iterative Ensemble Training with Anti-Gradient Control for Mitigating Memorization in Diffusion Models [20.550324116099357]
拡散モデルは、新規で高品質なサンプルを生成できることで知られている。
最近のメモリ緩和手法は、クロスモーダル生成タスクにおけるテキストモダリティ問題にのみ焦点をあてるか、あるいはデータ拡張戦略を利用するかのどちらかである。
本稿では,視覚的モダリティの観点からの拡散モデルのための新しいトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-22T02:19:30Z) - Continual Learning with Strong Experience Replay [32.154995019080594]
SER(Strong Experience Replay)を用いたCL法を提案する。
SERは、メモリバッファから過去の経験を蒸留する以外に、現在のトレーニングデータに模倣された将来の経験を利用する。
複数の画像分類データセットによる実験結果から,SER法が最先端の手法をはるかに上回ることがわかった。
論文 参考訳(メタデータ) (2023-05-23T02:42:54Z) - PIVOT: Prompting for Video Continual Learning [50.80141083993668]
PIVOTは、画像領域から事前学習したモデルにおける広範な知識を活用する新しい手法である。
実験の結果,PIVOTは20タスクのアクティビティネット設定において,最先端の手法を27%向上することがわかった。
論文 参考訳(メタデータ) (2022-12-09T13:22:27Z) - Class-Incremental Learning for Action Recognition in Videos [44.923719189467164]
ビデオ認識のためのクラス増分学習の文脈において、破滅的な忘れの問題に取り組む。
筆者らのフレームワークは、時間チャンネルの重要度マップを導入し、重要度マップを利用して、入ってくるサンプルの表現を学習することで、この課題に対処する。
提案手法は,UCF101, HMDB51, Some-Something V2データセット上に構築されたクラスインクリメンタルな行動認識ベンチマークを新たに分割する手法である。
論文 参考訳(メタデータ) (2022-03-25T12:15:49Z) - Practical Recommendations for Replay-based Continual Learning Methods [18.559132470835937]
継続学習では、以前の知識を忘れることなく、動的で非定常的なデータのストリームからモデルを学習する必要がある。
リプレイアプローチが最も効果的であることが実証的に証明されている。
論文 参考訳(メタデータ) (2022-03-19T12:44:44Z) - vCLIMB: A Novel Video Class Incremental Learning Benchmark [53.90485760679411]
本稿では,ビデオ連続学習ベンチマークvCLIMBを紹介する。
vCLIMBは、ビデオ連続学習における深層モデルの破滅的な忘れを解析するための標準化されたテストベッドである。
本稿では,メモリベース連続学習法に適用可能な時間的整合性正規化を提案する。
論文 参考訳(メタデータ) (2022-01-23T22:14:17Z) - An Investigation of Replay-based Approaches for Continual Learning [79.0660895390689]
連続学習(CL)は機械学習(ML)の大きな課題であり、破滅的忘れ(CF)を伴わずに連続的に複数のタスクを学習する能力を記述する。
いくつかの解クラスが提案されており、その単純さと堅牢性から、いわゆるリプレイベースのアプローチは非常に有望であるように思われる。
連続学習におけるリプレイに基づくアプローチを実証的に検討し,応用の可能性を評価する。
論文 参考訳(メタデータ) (2021-08-15T15:05:02Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Self-supervised Co-training for Video Representation Learning [103.69904379356413]
実例に基づく情報ノイズコントラスト推定訓練に意味クラス正の付加を施すことの利点について検討する。
本稿では,インフォネッションNCEの損失を改善するための,自己指導型協調学習手法を提案する。
本研究では,2つの下流タスク(行動認識とビデオ検索)における学習表現の質を評価する。
論文 参考訳(メタデータ) (2020-10-19T17:59:01Z) - Online Class-Incremental Continual Learning with Adversarial Shapley
Value [28.921534209869105]
本稿では、モデルがオンラインデータストリームから新しいクラスを継続的に学習する必要があるオンラインクラス増分設定に焦点を当てる。
そこで本研究では,遅延決定境界を保存する能力に基づいて,メモリデータサンプルをスコアリングする,新たなアディバーショナルシェープ値スコアリング手法を提案する。
全体として,提案手法は,様々なデータセット上での最先端のリプレイベース連続学習法と比較して,競争力や性能の向上を図っている。
論文 参考訳(メタデータ) (2020-08-31T20:52:27Z) - Delving into 3D Action Anticipation from Streaming Videos [99.0155538452263]
アクション予測は、部分的な観察でアクションを認識することを目的としている。
本稿では,いくつかの相補的評価指標を導入し,フレームワイド動作分類に基づく基本モデルを提案する。
また,全動作表現とクラス非依存行動ラベルという2つの側面から補助情報を取り入れたマルチタスク学習戦略についても検討する。
論文 参考訳(メタデータ) (2019-06-15T10:30:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。