論文の概要: A Comprehensive Study on Temporal Modeling for Online Action Detection
- arxiv url: http://arxiv.org/abs/2001.07501v1
- Date: Tue, 21 Jan 2020 13:12:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-08 00:39:33.496874
- Title: A Comprehensive Study on Temporal Modeling for Online Action Detection
- Title(参考訳): オンライン行動検出のための時間モデルに関する総合的研究
- Authors: Wen Wang, Xiaojiang Peng, Yu Qiao, Jian Cheng
- Abstract要約: オンライン行動検出(OAD)は実用的だが難しい課題であり、近年注目を集めている。
本稿では,4種類の時間的モデリング手法を含むOADの時間的モデリングに関する総合的研究を提案する。
本稿では,THUMOS-14 と TVSeries に対して,近年の最先端手法よりも大きなマージンを有するハイブリッド時間モデルを提案する。
- 参考スコア(独自算出の注目度): 50.558313106389335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Online action detection (OAD) is a practical yet challenging task, which has
attracted increasing attention in recent years. A typical OAD system mainly
consists of three modules: a frame-level feature extractor which is usually
based on pre-trained deep Convolutional Neural Networks (CNNs), a temporal
modeling module, and an action classifier. Among them, the temporal modeling
module is crucial which aggregates discriminative information from historical
and current features. Though many temporal modeling methods have been developed
for OAD and other topics, their effects are lack of investigation on OAD
fairly. This paper aims to provide a comprehensive study on temporal modeling
for OAD including four meta types of temporal modeling methods, \ie temporal
pooling, temporal convolution, recurrent neural networks, and temporal
attention, and uncover some good practices to produce a state-of-the-art OAD
system. Many of them are explored in OAD for the first time, and extensively
evaluated with various hyper parameters. Furthermore, based on our
comprehensive study, we present several hybrid temporal modeling methods, which
outperform the recent state-of-the-art methods with sizable margins on
THUMOS-14 and TVSeries.
- Abstract(参考訳): オンライン行動検出(OAD)は実用的だが難しい課題であり、近年注目を集めている。
典型的なOADシステムは3つのモジュールから構成される:フレームレベルの特徴抽出器は、通常、事前訓練された深層畳み込みニューラルネットワーク(CNN)、時間モデリングモジュール、アクション分類器である。
それらのうち、時間モデリングモジュールは重要であり、歴史的特徴と現在の特徴から識別情報を集約している。
OADや他のトピックに対して多くの時間的モデリング手法が開発されているが、それらの効果はOADについて十分に調査されていない。
本稿では,oadの時間的モデリングに関する包括的研究として,時間的モデリング手法である<ie>時間的プーリング,時間的畳み込み,再帰的ニューラルネットワーク,時間的注意の4つのメタ型を含む。
それらの多くは初めてOADで探索され、様々なハイパーパラメータで広く評価されている。
さらに,本研究の包括的研究に基づいて,thums-14とtvシリーズにおいて,最新の最先端手法に匹敵するハイブリッド時間モデリング手法を提案する。
関連論文リスト
- Joint Selective State Space Model and Detrending for Robust Time Series Anomaly Detection [25.60381244912307]
深層学習に基づくシーケンスモデルは時系列異常検出タスクに広く利用されている。
TSADの能力は、(i)長距離依存をモデル化する能力と(ii)非定常データの存在下での一般化問題という2つの主要な課題によって制限されている。
論文 参考訳(メタデータ) (2024-05-30T08:31:18Z) - Multi-Modality Spatio-Temporal Forecasting via Self-Supervised Learning [11.19088022423885]
そこで本稿では,MoSSL を利用した新しい学習フレームワークを提案する。
2つの実世界のMOSTデータセットの結果は、最先端のベースラインと比較して、我々のアプローチの優位性を検証する。
論文 参考訳(メタデータ) (2024-05-06T08:24:06Z) - Revisiting the Temporal Modeling in Spatio-Temporal Predictive Learning
under A Unified View [73.73667848619343]
UTEP(Unified S-Temporal Predictive Learning)は,マイクロテンポラリスケールとマクロテンポラリスケールを統合した再帰的および再帰的フリーな手法を再構築する,革新的なフレームワークである。
論文 参考訳(メタデータ) (2023-10-09T16:17:42Z) - A Neural PDE Solver with Temporal Stencil Modeling [44.97241931708181]
最近の機械学習(ML)モデルでは、高解像度信号において重要なダイナミクスを捉えることが約束されている。
この研究は、低解像度のダウンサンプリング機能で重要な情報が失われることがしばしばあることを示している。
本稿では,高度な時系列シーケンスモデリングと最先端のニューラルPDEソルバの強みを組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2023-02-16T06:13:01Z) - A Survey on Generative Diffusion Model [75.93774014861978]
拡散モデルは、深層生成モデルの新たなクラスである。
時間を要する反復生成過程や高次元ユークリッド空間への閉じ込めなど、いくつかの制限がある。
本調査では,拡散モデルの向上を目的とした高度な手法を多数提示する。
論文 参考訳(メタデータ) (2022-09-06T16:56:21Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z) - Temporal Relevance Analysis for Video Action Models [70.39411261685963]
まず,CNNに基づく行動モデルにより捉えたフレーム間の時間的関係を定量化する手法を提案する。
次に、時間的モデリングがどのように影響を受けるかをよりよく理解するために、包括的な実験と詳細な分析を行います。
論文 参考訳(メタデータ) (2022-04-25T19:06:48Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。