論文の概要: Video Domain Incremental Learning for Human Action Recognition in Home Environments
- arxiv url: http://arxiv.org/abs/2412.16946v1
- Date: Sun, 22 Dec 2024 09:40:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:58:17.981029
- Title: Video Domain Incremental Learning for Human Action Recognition in Home Environments
- Title(参考訳): 家庭環境における人間の行動認識のためのビデオドメインインクリメンタル学習
- Authors: Yuanda Hu, Xing Liu, Meiying Li, Yate Ge, Xiaohua Sun, Weiwei Guo,
- Abstract要約: ビデオドメインインクリメンタルラーニング(VDIL)の問題点を定式化する。
VDILは、モデルが一定のアクションクラスを維持しながら、異なるドメインから継続的に学習することを可能にする。
本研究では,制約のない家庭環境を対象としたドメインインクリメンタルな人間行動認識のベンチマークを紹介する。
- 参考スコア(独自算出の注目度): 5.8984266500487
- License:
- Abstract: It is significantly challenging to recognize daily human actions in homes due to the diversity and dynamic changes in unconstrained home environments. It spurs the need to continually adapt to various users and scenes. Fine-tuning current video understanding models on newly encountered domains often leads to catastrophic forgetting, where the models lose their ability to perform well on previously learned scenarios. To address this issue, we formalize the problem of Video Domain Incremental Learning (VDIL), which enables models to learn continually from different domains while maintaining a fixed set of action classes. Existing continual learning research primarily focuses on class-incremental learning, while the domain incremental learning has been largely overlooked in video understanding. In this work, we introduce a novel benchmark of domain incremental human action recognition for unconstrained home environments. We design three domain split types (user, scene, hybrid) to systematically assess the challenges posed by domain shifts in real-world home settings. Furthermore, we propose a baseline learning strategy based on replay and reservoir sampling techniques without domain labels to handle scenarios with limited memory and task agnosticism. Extensive experimental results demonstrate that our simple sampling and replay strategy outperforms most existing continual learning methods across the three proposed benchmarks.
- Abstract(参考訳): 制約のない家庭環境の多様性と動的変化のため、家庭における日々の人間の行動を認識することは極めて困難である。
さまざまなユーザやシーンに継続的に適応する必要が生じるのです。
新しく遭遇したドメイン上の微調整された現在のビデオ理解モデルは、しばしば破滅的な忘れを招き、モデルが以前に学習したシナリオでうまく機能する能力を失う。
この問題に対処するため,ビデオドメインインクリメンタルラーニング(VDIL)の問題を形式化し,モデルが一定のアクションクラスを維持しながら,異なるドメインから連続的に学習できるようにする。
既存の継続的な学習研究は主にクラス増分学習に焦点を当てているが、領域増分学習はビデオ理解においてほとんど見過ごされてきた。
本研究では,制約のない家庭環境を対象としたドメインインクリメンタルな人間行動認識のベンチマークを紹介する。
3つのドメイン分割タイプ(ユーザ、シーン、ハイブリッド)を設計し、実世界のホーム設定におけるドメインシフトによる課題を体系的に評価する。
さらに,記憶とタスク非依存のシナリオを扱うために,ドメインラベルのないリプレイと貯水池サンプリング技術に基づくベースライン学習戦略を提案する。
大規模な実験結果から,提案した3つのベンチマークにおいて,単純なサンプリングとリプレイ戦略が既存の継続学習手法よりも優れていたことが示唆された。
関連論文リスト
- Evaluating the Effectiveness of Video Anomaly Detection in the Wild: Online Learning and Inference for Real-world Deployment [2.1374208474242815]
Video Anomaly Detection (VAD) は、監視から医療まで幅広い応用の鍵となる、ビデオストリームにおける異常な活動を特定する。
実生活環境でのVADに取り組むことは、人間の行動の動的な性質、環境の変化、ドメインシフトによって大きな課題となる。
オンライン学習は、モデルを新しい情報に継続的に適応させることによって、この問題を軽減するための潜在的戦略である。
論文 参考訳(メタデータ) (2024-04-29T14:47:32Z) - Normalization Perturbation: A Simple Domain Generalization Method for
Real-World Domain Shifts [133.99270341855728]
実世界のドメインスタイルは環境の変化やセンサノイズによって大きく変化する可能性がある。
深層モデルはトレーニングドメインスタイルしか知らない。
このドメインスタイルのオーバーフィット問題を解決するために,正規化摂動を提案する。
論文 参考訳(メタデータ) (2022-11-08T17:36:49Z) - Forget Less, Count Better: A Domain-Incremental Self-Distillation
Learning Benchmark for Lifelong Crowd Counting [51.44987756859706]
オフザシェルフ法は複数のドメインを扱うのにいくつかの欠点がある。
生涯クラウドカウンティングは、壊滅的な忘れを緩和し、一般化能力を改善することを目的としている。
論文 参考訳(メタデータ) (2022-05-06T15:37:56Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Cross-domain Imitation from Observations [50.669343548588294]
模擬学習は、専門家の行動を利用して訓練エージェントに適切な報酬関数を設計することの難しさを回避しようとする。
本稿では,専門家とエージェントMDPの相違点が存在する場合に,タスクを模倣する方法の問題について検討する。
このようなドメイン間の対応を学習するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-20T21:08:25Z) - Lifelong Person Re-Identification via Adaptive Knowledge Accumulation [18.4671957106297]
LReID(Lifelong person re-identification)は、複数のドメインにわたって継続的に学習することができる。
知識表現と知識操作という2つの重要な能力を備えた適応的知識蓄積フレームワークを設計する。
本手法は見かけのドメインの破滅的な忘れることを軽減し,未知のドメインに一般化する能力を示す。
論文 参考訳(メタデータ) (2021-03-23T11:30:38Z) - Gradient Regularized Contrastive Learning for Continual Domain
Adaptation [86.02012896014095]
本稿では,ラベル付きソースドメインと非ラベル付きターゲットドメインのシーケンスでモデルを提示する連続的なドメイン適応の問題について検討する。
障害を解決するため,グラディエント正規化コントラスト学習(GRCL)を提案する。
Digits、DomainNet、Office-Caltechベンチマークの実験は、我々のアプローチの強力なパフォーマンスを示しています。
論文 参考訳(メタデータ) (2021-03-23T04:10:42Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - ADAIL: Adaptive Adversarial Imitation Learning [11.270858993502705]
本稿では,動的に変化する環境間で伝達可能な適応型ポリシーを学習するための適応型適応型適応模倣学習(ADAIL)アルゴリズムを提案する。
これはロボット学習において重要な問題であり,1)報酬関数の取得が困難であること,2)ドメイン統計を対象とするさまざまなソースによる学習方針の展開が困難であること,3)動的に知られ制御される複数の環境における専門家によるデモンストレーションの収集が不可能であること,などが挙げられる。
論文 参考訳(メタデータ) (2020-08-23T06:11:00Z) - Latent Domain Learning with Dynamic Residual Adapters [26.018759356470767]
ディープニューラルネットワークの現実的な欠点は、単一のタスクとドメインへの特殊化である。
ドメインアノテーションへのアクセスなしに、複数のドメインからデータから学ぶことです。
我々はこの制限を動的残留アダプタ(潜伏領域を考慮に入れた適応ゲーティング機構)を介して解決する。
論文 参考訳(メタデータ) (2020-06-01T15:00:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。