論文の概要: Temporal Relevance Analysis for Video Action Models
- arxiv url: http://arxiv.org/abs/2204.11929v1
- Date: Mon, 25 Apr 2022 19:06:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 13:34:21.794456
- Title: Temporal Relevance Analysis for Video Action Models
- Title(参考訳): ビデオアクションモデルの時間的関連性解析
- Authors: Quanfu Fan, Donghyun Kim, Chun-Fu (Richard) Chen, Stan Sclaroff, Kate
Saenko, Sarah Adel Bargal
- Abstract要約: まず,CNNに基づく行動モデルにより捉えたフレーム間の時間的関係を定量化する手法を提案する。
次に、時間的モデリングがどのように影響を受けるかをよりよく理解するために、包括的な実験と詳細な分析を行います。
- 参考スコア(独自算出の注目度): 70.39411261685963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we provide a deep analysis of temporal modeling for action
recognition, an important but underexplored problem in the literature. We first
propose a new approach to quantify the temporal relationships between frames
captured by CNN-based action models based on layer-wise relevance propagation.
We then conduct comprehensive experiments and in-depth analysis to provide a
better understanding of how temporal modeling is affected by various factors
such as dataset, network architecture, and input frames. With this, we further
study some important questions for action recognition that lead to interesting
findings. Our analysis shows that there is no strong correlation between
temporal relevance and model performance; and action models tend to capture
local temporal information, but less long-range dependencies. Our codes and
models will be publicly available.
- Abstract(参考訳): 本稿では,行動認識のための時間的モデリングの深層的分析について述べる。
まず,cnnに基づく行動モデルで捉えたフレーム間の時間的関係を層間関係伝播に基づいて定量化する新しい手法を提案する。
次に、データセット、ネットワークアーキテクチャ、入力フレームなどの様々な要因によって、時間的モデリングがどのように影響を受けるかをより深く理解するために、包括的な実験と詳細な分析を行う。
これにより、興味深い発見につながる行動認識に関する重要な疑問をさらに研究する。
その結果,時間的関連性とモデル性能には強い相関性が認められず,行動モデルでは局所的時間的情報をキャプチャする傾向が見られた。
私たちのコードとモデルは公開されます。
関連論文リスト
- Temporal receptive field in dynamic graph learning: A comprehensive analysis [15.161255747900968]
本稿では,動的グラフ学習における時間受容領域の包括的解析について述べる。
その結果,適切な時間的受容場を選択すれば,モデルの性能が大幅に向上することが示された。
一部のモデルでは、過度に大きなウィンドウがノイズを発生させ、精度を低下させる。
論文 参考訳(メタデータ) (2024-07-17T07:46:53Z) - Spatio-Temporal Graphical Counterfactuals: An Overview [11.616701619068804]
反現実は、人工知能がデータから知識を学習する上で、重要かつ困難なトピックである。
本研究の目的は,思考を比較し,異なる対実モデル,理論,アプローチについて議論することである。
論文 参考訳(メタデータ) (2024-07-02T01:34:13Z) - A Survey on Diffusion Models for Time Series and Spatio-Temporal Data [92.1255811066468]
時系列およびS時間データにおける拡散モデルの使用について概観し、それらをモデル、タスクタイプ、データモダリティ、実用的なアプリケーションドメインで分類する。
我々は拡散モデルを無条件型と条件付き型に分類し、時系列とS時間データを別々に議論する。
本調査は,医療,レコメンデーション,気候,エネルギー,オーディオ,交通など,さまざまな分野の応用を幅広くカバーしている。
論文 参考訳(メタデータ) (2024-04-29T17:19:40Z) - Are Neural Topic Models Broken? [81.15470302729638]
トピックモデルの自動評価と人的評価の関係について検討する。
ニューラルトピックモデルは、確立された古典的手法と比較して、両方の点においてより悪くなる。
論文 参考訳(メタデータ) (2022-10-28T14:38:50Z) - Recur, Attend or Convolve? Frame Dependency Modeling Matters for
Cross-Domain Robustness in Action Recognition [0.5448283690603357]
従来,2次元畳み込みニューラルネットワーク(CNN)は,コンピュータビジョンタスクの形状よりもテクスチャに偏っている傾向があった。
これは、大きなビデオモデルが時間の経過とともに関連した形状を追跡するのではなく、急激な相関関係を学習しているという疑いを提起する。
本研究では, フレーム依存性のモデリングによって, 連続的, 注意的, 畳み込み的ビデオモデルに対するドメイン間ロバスト性について検討した。
論文 参考訳(メタデータ) (2021-12-22T19:11:53Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - Modeling long-term interactions to enhance action recognition [81.09859029964323]
本稿では,フレームレベルと時間レベルの両方でオブジェクト間の相互作用のセマンティクスを利用する,エゴセントリックなビデオのアンダースタンドアクションに対する新しいアプローチを提案する。
ユーザの手とほぼ対応するプライマリ領域と、相互作用するオブジェクトに対応する可能性のあるセカンダリ領域のセットを入力として、領域ベースのアプローチを使用する。
提案手法は, 標準ベンチマークの動作認識において, 最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-23T10:08:15Z) - Unified Graph Structured Models for Video Understanding [93.72081456202672]
リレーショナル・テンポラル関係を明示的にモデル化するメッセージパッシンググラフニューラルネットワークを提案する。
本手法は,シーン内の関連エンティティ間の関係をより効果的にモデル化できることを示す。
論文 参考訳(メタデータ) (2021-03-29T14:37:35Z) - A Gated Fusion Network for Dynamic Saliency Prediction [16.701214795454536]
Gated Fusion Network for dynamic saliency (GFSalNet)
GFSalNetはゲート融合機構を介して動的に予測を行うことができる最初のディープサリエンシーモデルです。
さらに,その適応的融合手法により,時間情報をより効果的に活用できることを示す。
論文 参考訳(メタデータ) (2021-02-15T17:18:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。