Fugu-MT 論文翻訳(概要): Multi class activity classification in videos using Motion History Image generation

論文の概要: Multi class activity classification in videos using Motion History Image generation

arxiv url: http://arxiv.org/abs/2410.09902v1
Date: Sun, 13 Oct 2024 16:22:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-30 04:23:08.548457
Title: Multi class activity classification in videos using Motion History Image generation
Title（参考訳）: モーションヒストリー画像生成を用いたビデオのマルチクラスアクティビティ分類
Authors: Senthilkumar Gopal,
Abstract要約: 運動履歴画像は、時間的・活動的な情報を多次元的詳細に捉えるための、よく確立された枠組みであることを示す。我々は、MHIを用いてサンプルデータを作成し、分類器を訓練し、単一のマルチアクションビデオにおいて、6つの異なるアクティビティにわたるアクション分類の有効性を実証する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Human action recognition has been a topic of interest across multiple fields ranging from security to entertainment systems. Tracking the motion and identifying the action being performed on a real time basis is necessary for critical security systems. In entertainment, especially gaming, the need for immediate responses for actions and gestures are paramount for the success of that system. We show that Motion History image has been a well established framework to capture the temporal and activity information in multi dimensional detail enabling various usecases including classification. We utilize MHI to produce sample data to train a classifier and demonstrate its effectiveness for action classification across six different activities in a single multi-action video. We analyze the classifier performance and identify usecases where MHI struggles to generate the appropriate activity image and discuss mechanisms and future work to overcome those limitations.
Abstract（参考訳）: 人間の行動認識は、セキュリティからエンターテイメントシステムまで、さまざまな分野において関心を集めてきた。重要なセキュリティシステムには、動作を追跡し、リアルタイムに実行される動作を特定する必要があります。エンターテイメント、特にゲームにおいて、アクションやジェスチャーに対する即時応答の必要性は、そのシステムの成功にとって最重要である。動作履歴画像は、時間的・活動的な情報を多次元の細部で捉え、分類を含む様々なユースケースを実現するための、よく確立された枠組みであることを示す。我々は、MHIを用いてサンプルデータを作成し、分類器を訓練し、単一のマルチアクションビデオにおいて、6つの異なるアクティビティにわたるアクション分類の有効性を実証する。我々は、分類器の性能を分析し、MHIが適切な活動画像を生成するのに苦労しているユースケースを特定し、それらの制限を克服するためのメカニズムや今後の作業について議論する。

関連論文リスト

A Comprehensive Review of Few-shot Action Recognition [64.47305887411275]
アクション認識は、複雑で可変なビデオデータを手動でラベル付けすることのコストと非現実性に対処することを目的としている。ビデオ中の人間のアクションを正確に分類するには、クラスごとにいくつかのラベル付き例だけを使用する必要がある。
論文参考訳（メタデータ） (2024-07-20T03:53:32Z)
Video Action Detection: Analysing Limitations and Challenges [70.01260415234127]
ビデオ行動検出における既存のデータセットを分析し,その限界について議論する。静的画像から映像を区別する重要な特性である時間的側面を解析するバイアスネススタディを実行する。このような極端な実験は、注意深いモデリングを必要とする既存の手法に忍び込んだバイアスの存在を示している。
論文参考訳（メタデータ） (2022-04-17T00:42:14Z)
PAMI-AD: An Activity Detector Exploiting Part-attention and Motion Information in Surveillance Videos [6.4515884598231]
PAMI-ADは、無人監視ビデオのアクティビティ検出システムである。マルチオブジェクト追跡、バックグラウンドモデリング、アクティビティ分類器、後処理の4つのモジュールで構成されている。私たちのチームは、TRECVID 2021 ActEVチャレンジで1位を獲得しました。
論文参考訳（メタデータ） (2022-03-08T01:36:26Z)
Temporal Action Segmentation with High-level Complex Activity Labels [29.17792724210746]
我々は、高レベルなアクティビティラベルのみを入力とするアクションセグメントを学習する。本稿では,ビデオ中の構成要素を自動検出する新しいアクション発見フレームワークを提案する。
論文参考訳（メタデータ） (2021-08-15T09:50:42Z)
Human Action Recognition Based on Multi-scale Feature Maps from Depth Video Sequences [12.30399970340689]
深度ビデオシーケンスから人間の行動を認識するために,マルチスケールなモーション情報に着目した新しいフレームワークを提案する。動作のマルチスケールな静的表現を生成するために,テンプレートとして深度動き画像(DMI)を用いる。 LP-DMI-HOGと呼ばれる多粒性記述子を抽出し、より識別的な特徴を提供する。
論文参考訳（メタデータ） (2021-01-19T13:46:42Z)
Coarse Temporal Attention Network (CTA-Net) for Driver's Activity Recognition [14.07119502083967]
ドライバーの活動は、同様の身体部分の動きで同じ被験者によって実行され、微妙な変化をもたらすため、異なります。我々のモデルはCTA-Net(Coarse Temporal Attention Network)と呼ばれ、粗い時間枝をトレーニング可能な視点で導入する。モデルは革新的なアテンションメカニズムを使用して、アクティビティ認識のための高レベルなアクション固有のコンテキスト情報を生成する。
論文参考訳（メタデータ） (2021-01-17T10:15:37Z)
Intra- and Inter-Action Understanding via Temporal Action Parsing [118.32912239230272]
本研究では,スポーツビデオにサブアクションの手動アノテーションを付加した新しいデータセットを構築し,その上に時間的行動解析を行う。スポーツ活動は通常、複数のサブアクションから構成されており、このような時間構造に対する意識は、行動認識に有益であることを示す。また,時間的解析手法を多数検討し,そのラベルを知らずにトレーニングデータからサブアクションをマイニングできる改良手法を考案した。
論文参考訳（メタデータ） (2020-05-20T17:45:18Z)
Gabriella: An Online System for Real-Time Activity Detection in Untrimmed Security Videos [72.50607929306058]
本研究では,未トリミングされたセキュリティビデオ上でのアクティビティ検出をリアルタイムに行うオンラインシステムを提案する。提案手法は, チューブレット抽出, 活性分類, オンラインチューブレットマージの3段階からなる。提案手法の有効性を,100fps(100fps)と最新技術による性能評価で実証した。
論文参考訳（メタデータ） (2020-04-23T22:20:10Z)
Revisiting Few-shot Activity Detection with Class Similarity Control [107.79338380065286]
本稿では,提案回帰に基づく数ショットの時間的活動検出のためのフレームワークを提案する。我々のモデルはエンドツーエンドのトレーニングが可能で、数ショットのアクティビティと未トリミングなテストビデオのフレームレートの違いを考慮しており、さらに数ショットのサンプルの恩恵を受けることができる。
論文参考訳（メタデータ） (2020-03-31T22:02:38Z)
ZSTAD: Zero-Shot Temporal Activity Detection [107.63759089583382]
本研究では,ゼロショット時間的活動検出(ZSTAD)と呼ばれる新たなタスク設定を提案する。このソリューションのアーキテクチャとして,R-C3Dに基づくエンドツーエンドのディープネットワークを設計する。 THUMOS14とCharadesデータセットの両方の実験は、目に見えない活動を検出するという点で有望なパフォーマンスを示している。
論文参考訳（メタデータ） (2020-03-12T02:40:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。