論文の概要: Spatio-Temporal Human Action Recognition Modelwith Flexible-interval
Sampling and Normalization
- arxiv url: http://arxiv.org/abs/2108.05633v1
- Date: Thu, 12 Aug 2021 10:02:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 23:27:55.698247
- Title: Spatio-Temporal Human Action Recognition Modelwith Flexible-interval
Sampling and Normalization
- Title(参考訳): フレキシブルインターバルサンプリングと正規化を用いた時空間人間行動認識モデル
- Authors: Yuke, Yang
- Abstract要約: 設計モジュールを用いた赤緑色(RGB)ビデオ入力のためのヒューマンアクションシステムを提案する。
我々は、人間のキーポイント予測と行動認識の両方に対して、類似した背景と差別的な行動を持つ新しいデータセットを構築した。
実験により,提案モデルの有効性を,我々の行動認識データセットといくつかの公開データセットで実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human action recognition is a well-known computer vision and pattern
recognition task of identifying which action a man is actually doing.
Extracting the keypoint information of a single human with both spatial and
temporal features of action sequences plays an essential role to accomplish the
task.In this paper, we propose a human action system for Red-Green-Blue(RGB)
input video with our own designed module. Based on the efficient Gated
Recurrent Unit(GRU) for spatio-temporal feature extraction, we add another
sampling module and normalization module to improve the performance of the
model in order to recognize the human actions. Furthermore, we build a novel
dataset with a similar background and discriminative actions for both human
keypoint prediction and behavior recognition. To get a better result, we
retrain the pose model with our new dataset to get better performance.
Experimental results demonstrate the effectiveness of the proposed model on our
own human behavior recognition dataset and some public datasets.
- Abstract(参考訳): ヒューマンアクション認識(human action recognition)は、人間が実際に行っている行動を特定するためのコンピュータビジョンおよびパターン認識タスクである。
そこで本稿では,赤緑青(RGB)入力ビデオのためのヒューマン・アクション・システムを提案し,その動作の時空間的特徴と時空間的特徴を兼ね備えた単一人間のキーポイント情報を抽出する。
時空間特徴抽出のための効率的な Gated Recurrent Unit (GRU) に基づいて,人間の行動を認識するために,サンプルモジュールと正規化モジュールを追加し,モデルの性能を向上させる。
さらに,人間のキーポイント予測と行動認識の両方に対して,類似した背景と識別行動を持つ新しいデータセットを構築する。
より良い結果を得るために、新しいデータセットでポーズモデルを再トレーニングし、パフォーマンスを改善します。
実験の結果,提案モデルが人間の行動認識データセットといくつかの公開データセットに与える影響が実証された。
関連論文リスト
- Understanding Spatio-Temporal Relations in Human-Object Interaction using Pyramid Graph Convolutional Network [2.223052975765005]
本稿では,人間と物体の相互作用を自動的に認識する新しいピラミッドグラフ畳み込みネットワーク(PGCN)を提案する。
このシステムは、映像データをグラフとして検出した結果から、人間と物体の2次元または3次元空間関係を表す。
我々は,人間と物体の相互作用認識の分野で,2つの挑戦的データセット上でモデルを評価した。
論文 参考訳(メタデータ) (2024-10-10T13:39:17Z) - Texture-Based Input Feature Selection for Action Recognition [3.9596068699962323]
本稿では,ドメインの差分を増大させる入力におけるタスク関連コンテンツを決定する新しい手法を提案する。
提案モデルは,HMDB-51データセットとPenn Actionデータセットにおいて,既存の行動認識モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-02-28T23:56:31Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Revisiting spatio-temporal layouts for compositional action recognition [63.04778884595353]
私たちは、アクション認識にオブジェクト中心のアプローチを取ります。
本論文の主な焦点は、合成/ファウショット動作認識である。
レイアウトモデルとの融合による外観モデルの性能向上を実証する。
論文 参考訳(メタデータ) (2021-11-02T23:04:39Z) - Skeleton-Based Mutually Assisted Interacted Object Localization and
Human Action Recognition [111.87412719773889]
本研究では,骨格データに基づく「相互作用対象の局所化」と「人間の行動認識」のための共同学習フレームワークを提案する。
本手法は,人間の行動認識のための最先端の手法を用いて,最高の,あるいは競争的な性能を実現する。
論文 参考訳(メタデータ) (2021-10-28T10:09:34Z) - STAR: Sparse Transformer-based Action Recognition [61.490243467748314]
本研究は,空間的次元と時間的次元に細かな注意を払っている新しいスケルトンに基づく人間行動認識モデルを提案する。
実験により、トレーニング可能なパラメータをはるかに少なくし、トレーニングや推論の高速化を図りながら、モデルが同等のパフォーマンスを達成できることが示されている。
論文 参考訳(メタデータ) (2021-07-15T02:53:11Z) - TRiPOD: Human Trajectory and Pose Dynamics Forecasting in the Wild [77.59069361196404]
TRiPODは、グラフの注目ネットワークに基づいて身体のダイナミクスを予測する新しい方法です。
実世界の課題を取り入れるために,各フレームで推定された身体関節が可視・視認可能かどうかを示す指標を学習する。
評価の結果,TRiPODは,各軌道に特化して設計され,予測タスクに特化している。
論文 参考訳(メタデータ) (2021-04-08T20:01:00Z) - Pose And Joint-Aware Action Recognition [87.4780883700755]
本稿では,まず,共有動作エンコーダを用いて各関節の動作特徴を別々に抽出する,関節に基づく動作認識の新しいモデルを提案する。
私たちのジョイントセレクタモジュールは、そのタスクの最も識別性の高いジョイントを選択するために、ジョイント情報を再重み付けします。
JHMDB, HMDB, Charades, AVA アクション認識データセットにおける最先端のジョイントベースアプローチに対する大きな改善点を示す。
論文 参考訳(メタデータ) (2020-10-16T04:43:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。