論文の概要: Delving into 3D Action Anticipation from Streaming Videos
- arxiv url: http://arxiv.org/abs/1906.06521v2
- Date: Thu, 15 Jun 2023 00:09:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-17 04:47:10.878794
- Title: Delving into 3D Action Anticipation from Streaming Videos
- Title(参考訳): ストリーミングビデオから3dアクションの予測を探究する
- Authors: Hongsong Wang and Jiashi Feng
- Abstract要約: アクション予測は、部分的な観察でアクションを認識することを目的としている。
本稿では,いくつかの相補的評価指標を導入し,フレームワイド動作分類に基づく基本モデルを提案する。
また,全動作表現とクラス非依存行動ラベルという2つの側面から補助情報を取り入れたマルチタスク学習戦略についても検討する。
- 参考スコア(独自算出の注目度): 99.0155538452263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Action anticipation, which aims to recognize the action with a partial
observation, becomes increasingly popular due to a wide range of applications.
In this paper, we investigate the problem of 3D action anticipation from
streaming videos with the target of understanding best practices for solving
this problem. We first introduce several complementary evaluation metrics and
present a basic model based on frame-wise action classification. To achieve
better performance, we then investigate two important factors, i.e., the length
of the training clip and clip sampling method. We also explore multi-task
learning strategies by incorporating auxiliary information from two aspects:
the full action representation and the class-agnostic action label. Our
comprehensive experiments uncover the best practices for 3D action
anticipation, and accordingly we propose a novel method with a multi-task loss.
The proposed method considerably outperforms the recent methods and exhibits
the state-of-the-art performance on standard benchmarks.
- Abstract(参考訳): 部分的な観察で行動を認識することを目的とした行動予測は、幅広い応用により、ますます人気が高まっている。
本稿では,ストリーミングビデオからの3次元行動予測の問題を,この問題に対するベストプラクティスの理解を目的として検討する。
まず,いくつかの相補的評価指標を導入し,フレームワイド動作分類に基づく基本モデルを提案する。
より良い性能を実現するために,訓練クリップの長さとクリップサンプリング法という2つの重要な要因を調査した。
また,全動作表現とクラス非依存行動ラベルという2つの側面から補助情報を取り入れたマルチタスク学習戦略についても検討する。
総合的な実験により,3次元動作予測のベストプラクティスを明らかにし,マルチタスクロスを用いた新しい手法を提案する。
提案手法は,最近の手法をかなり上回り,標準ベンチマークにおける最先端性能を示す。
関連論文リスト
- Semi-supervised Active Learning for Video Action Detection [8.110693267550346]
我々はラベル付きデータとラベルなしデータの両方を利用する、新しい半教師付きアクティブラーニング手法を開発した。
提案手法は,UCF-24-101,JHMDB-21,Youtube-VOSの3種類のベンチマークデータセットに対して評価を行った。
論文 参考訳(メタデータ) (2023-12-12T11:13:17Z) - Early Action Recognition with Action Prototypes [62.826125870298306]
本稿では,各クラスに対するフルアクションのプロトタイプ表現を学習する新しいモデルを提案する。
映像を短いクリップに分解し、視覚エンコーダがそれぞれのクリップから特徴を独立して抽出する。
その後、デコーダは、最終クラスの予測のために、すべてのクリップからオンラインのファッション機能として集約される。
論文 参考訳(メタデータ) (2023-12-11T18:31:13Z) - A baseline on continual learning methods for video action recognition [15.157938674002793]
継続学習は、古典的な教師付きモデルの長期的制限を解決することを目的としている。
本稿では,映像行動認識における最先端の連続学習手法のベンチマークを示す。
論文 参考訳(メタデータ) (2023-04-20T14:20:43Z) - Weakly Supervised Two-Stage Training Scheme for Deep Video Fight
Detection Model [0.0]
ビデオにおけるファイト検出は、今日の監視システムとストリーミングメディアの普及にともなう、新たなディープラーニングアプリケーションである。
これまでの研究は、この問題に対処するための行動認識技術に大きく依存していた。
本研究では,動作認識特徴抽出器と異常スコア生成器の合成として,戦闘検出モデルを設計する。
論文 参考訳(メタデータ) (2022-09-23T08:29:16Z) - SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video
Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。
マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。
モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文 参考訳(メタデータ) (2022-07-16T19:25:41Z) - A Training Method For VideoPose3D With Ideology of Action Recognition [0.9949781365631559]
本研究は,行動認識に基づくビデオPose3Dのより高速で柔軟なトレーニング手法を示す。
アクション指向と一般的なポーズ推定の両方の問題を扱うことができる。
論文 参考訳(メタデータ) (2022-06-13T19:25:27Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Recent Progress in Appearance-based Action Recognition [73.6405863243707]
アクション認識は、ビデオ内の様々な人間の行動を特定するタスクである。
最近の外見に基づく手法は、正確な行動認識に向けて有望な進歩を遂げている。
論文 参考訳(メタデータ) (2020-11-25T10:18:12Z) - On Evaluating Weakly Supervised Action Segmentation Methods [79.42955857919497]
本研究は、弱い教師付き行動セグメント化アプローチの使用と評価の2つの側面に焦点を当てる。
それぞれの手法をBreakfastデータセット上で5回トレーニングし、平均および標準偏差を提供する。
実験の結果,これらの反復に対する標準偏差は1~2.5%であり,異なるアプローチの比較に大きく影響していることがわかった。
論文 参考訳(メタデータ) (2020-05-19T20:30:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。