論文の概要: Video-based Human Action Recognition using Deep Learning: A Review
- arxiv url: http://arxiv.org/abs/2208.03775v1
- Date: Sun, 7 Aug 2022 17:12:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-09 13:26:25.411577
- Title: Video-based Human Action Recognition using Deep Learning: A Review
- Title(参考訳): 深層学習を用いた映像ベースヒューマンアクション認識:レビュー
- Authors: Hieu H. Pham, Louahdi Khoudour, Alain Crouzil, Pablo Zegers, Sergio A.
Velastin
- Abstract要約: 人間の行動認識はコンピュータビジョンにおける重要な応用分野である。
ディープラーニングはコンピュータビジョンコミュニティによって特に注目されている。
本稿では,深層学習技術を用いた映像解析による行動認識の現状について概説する。
- 参考スコア(独自算出の注目度): 4.976815699476327
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human action recognition is an important application domain in computer
vision. Its primary aim is to accurately describe human actions and their
interactions from a previously unseen data sequence acquired by sensors. The
ability to recognize, understand, and predict complex human actions enables the
construction of many important applications such as intelligent surveillance
systems, human-computer interfaces, health care, security, and military
applications. In recent years, deep learning has been given particular
attention by the computer vision community. This paper presents an overview of
the current state-of-the-art in action recognition using video analysis with
deep learning techniques. We present the most important deep learning models
for recognizing human actions, and analyze them to provide the current progress
of deep learning algorithms applied to solve human action recognition problems
in realistic videos highlighting their advantages and disadvantages. Based on
the quantitative analysis using recognition accuracies reported in the
literature, our study identifies state-of-the-art deep architectures in action
recognition and then provides current trends and open problems for future works
in this field.
- Abstract(参考訳): ヒューマンアクション認識はコンピュータビジョンの重要な応用領域である。
その主な目的は、センサが取得した未確認データシーケンスから、人間の行動とその相互作用を正確に記述することである。
複雑な人間の行動を認識し、理解し、予測する能力は、インテリジェントな監視システム、ヒューマンコンピュータインターフェース、医療、セキュリティ、軍事アプリケーションなど、多くの重要なアプリケーションの構築を可能にする。
近年、ディープラーニングはコンピュータビジョンコミュニティによって特に注目されている。
本稿では,深層学習技術を用いた映像解析による行動認識の現状について概説する。
本稿では,人間の行動を認識するための最も重要な深層学習モデルを提示し,その利点と欠点を強調するリアルビデオにおける人間の行動認識問題を解決するために応用される深層学習アルゴリズムの進歩を解析する。
本研究は,文献に報告されている認識能力を用いた定量的分析に基づいて,行動認識における最先端の深層アーキテクチャを同定し,今後の動向と今後の課題について述べる。
関連論文リスト
- A Critical Analysis on Machine Learning Techniques for Video-based Human Activity Recognition of Surveillance Systems: A Review [1.3693860189056777]
混雑した場所での異常な活動の増大は、インテリジェントな監視システムの必要性を喚起する。
ビデオに基づく人間の活動認識は、そのプレス問題で多くの研究者を惹きつけている。
本稿では,映像に基づくヒューマンアクティビティ認識(HAR)技術について批判的な調査を行う。
論文 参考訳(メタデータ) (2024-09-01T14:43:57Z) - Emotion Recognition from the perspective of Activity Recognition [0.0]
人間の感情状態、行動、反応を現実世界の環境に適応させることは、潜伏した連続した次元を用いて達成できる。
感情認識システムが現実のモバイルおよびコンピューティングデバイスにデプロイされ統合されるためには、世界中の収集されたデータを考慮する必要がある。
本稿では,注目機構を備えた新しい3ストリームエンドツーエンドのディープラーニング回帰パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-24T18:53:57Z) - Computer Vision for Primate Behavior Analysis in the Wild [61.08941894580172]
ビデオに基づく行動監視は、動物の認知と行動を研究する方法を変える大きな可能性を秘めている。
今でも、エキサイティングな見通しと、今日実際に達成できるものの間には、かなり大きなギャップがある。
論文 参考訳(メタデータ) (2024-01-29T18:59:56Z) - Deep Neural Networks in Video Human Action Recognition: A Review [21.00217656391331]
映像行動認識はコンピュータビジョンの最も基本的なタスクの1つである。
ディープニューラルネットワークは、RGB、RGB-D、光学フローフォーマットなどの画像のようなピクセルレベルの情報を認識するために構築されている。
本稿では,深層ニューラルネットワークの性能が,特徴学習および抽出タスクにおけるほとんどの技術を上回った。
論文 参考訳(メタデータ) (2023-05-25T03:54:41Z) - Context-Aware Sequence Alignment using 4D Skeletal Augmentation [67.05537307224525]
コンピュータビジョン、ロボティクス、混合現実の多くの応用において、ビデオにおける人間の行動の微粒化の時間的アライメントが重要である。
本稿では,アクションのシーケンスを整列するコンテキスト認識型自己教師型学習アーキテクチャを提案する。
特に、CASAは、人間の行動の空間的・時間的文脈を組み込むために、自己注意と相互注意のメカニズムを採用している。
論文 参考訳(メタデータ) (2022-04-26T10:59:29Z) - Classifying Human Activities with Inertial Sensors: A Machine Learning
Approach [0.0]
HAR(Human Activity Recognition)は、現在進行中の研究課題である。
医療サポート、スポーツ、フィットネス、ソーシャルネットワーキング、ヒューマン・コンピュータ・インタフェース、シニア・ケア、エンターテイメント、監視などの分野に応用されている。
スマートフォンの慣性センサデータを用いて,人間活動認識のための機械学習と深層学習のアプローチを検討した。
論文 参考訳(メタデータ) (2021-11-09T08:17:33Z) - Affect Analysis in-the-wild: Valence-Arousal, Expressions, Action Units
and a Unified Framework [83.21732533130846]
Aff-Wild と Aff-Wild2 の2つである。
これは、これらのデータベースで訓練された深層ニューラルネットワークの2つのクラスの設計を示す。
インパクト認識を共同で学び、効果的に一般化し、実行することができる新しいマルチタスクおよび全体主義のフレームワークが提示されます。
論文 参考訳(メタデータ) (2021-03-29T17:36:20Z) - Continuous Emotion Recognition with Spatiotemporal Convolutional Neural
Networks [82.54695985117783]
In-theld でキャプチャした長いビデオシーケンスを用いて,持続的な感情認識のための最先端のディープラーニングアーキテクチャの適合性を検討する。
我々は,2D-CNNと長期記憶ユニットを組み合わせた畳み込みリカレントニューラルネットワークと,2D-CNNモデルの微調整時の重みを膨らませて構築した膨らませた3D-CNNモデルを開発した。
論文 参考訳(メタデータ) (2020-11-18T13:42:05Z) - A Grid-based Representation for Human Action Recognition [12.043574473965318]
ビデオにおけるヒューマンアクション認識(HAR)は、コンピュータビジョンにおける基本的な研究課題である。
本稿では,行動の最も識別性の高い外観情報を効率的に符号化する行動認識手法を提案する。
提案手法は, モデルが人間の行動を正確に認識できることを示すために, いくつかのベンチマークデータセットで検証される。
論文 参考訳(メタデータ) (2020-10-17T18:25:00Z) - Continuous Emotion Recognition via Deep Convolutional Autoencoder and
Support Vector Regressor [70.2226417364135]
マシンはユーザの感情状態を高い精度で認識できることが不可欠である。
ディープニューラルネットワークは感情を認識する上で大きな成功を収めている。
表情認識に基づく連続的感情認識のための新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-01-31T17:47:16Z) - Deep Learning for Sensor-based Human Activity Recognition: Overview,
Challenges and Opportunities [52.59080024266596]
本稿では,センサを用いた人間の活動認識のための最先端のディープラーニング手法について調査する。
まず、官能データのマルチモーダリティを導入し、公開データセットに情報を提供する。
次に、課題によって深層メソッドを構築するための新しい分類法を提案する。
論文 参考訳(メタデータ) (2020-01-21T09:55:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。