Fugu-MT 論文翻訳(概要): Action recognition in real-world videos

論文の概要: Action recognition in real-world videos

arxiv url: http://arxiv.org/abs/2004.10774v1
Date: Wed, 22 Apr 2020 18:02:50 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-10 18:40:27.914100
Title: Action recognition in real-world videos
Title（参考訳）: 実世界ビデオにおける行動認識
Authors: Waqas Sultani, Qazi Ammar Arshad, Chen Chen
Abstract要約: 人間の行動認識のゴールは、ビデオシーケンスにおける人間の行動の時間的または空間的局所化である。この章では、アクション、アクティビティ、イベントを相互に使用しています。
参考スコア（独自算出の注目度）: 7.207514853364179
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The goal of human action recognition is to temporally or spatially localize the human action of interest in video sequences. Temporal localization (i.e. indicating the start and end frames of the action in a video) is referred to as frame-level detection. Spatial localization, which is more challenging, means to identify the pixels within each action frame that correspond to the action. This setting is usually referred to as pixel-level detection. In this chapter, we are using action, activity, event interchangeably.
Abstract（参考訳）: 人間の行動認識の目標は、ビデオシーケンスにおける人間の行動の時間的または空間的局所化である。時間的局在(つまり、映像中の動作の開始と終了のフレームを示す)は、フレームレベル検出 (frame level detection) と呼ばれる。空間的局在化はより困難であり、アクションに対応する各アクションフレーム内のピクセルを識別することを意味する。この設定は通常ピクセルレベルの検出と呼ばれる。この章では、アクション、アクティビティ、イベントを相互に使用しています。

関連論文リスト

A Semantic and Motion-Aware Spatiotemporal Transformer Network for Action Detection [7.202931445597171]
本稿では,未編集映像の動作を検出する新しいネットワークを提案する。このネットワークは、モーション対応2D位置符号化を利用して、ビデオフレーム内のアクションセマンティクスの位置を符号化する。このアプローチは、4つの提案されたデータセット上で最先端のソリューションよりも優れています。
論文参考訳（メタデータ） (2024-05-13T21:47:35Z)
Rethinking CLIP-based Video Learners in Cross-Domain Open-Vocabulary Action Recognition [84.31749632725929]
本稿では,この課題の1つの重要な課題,すなわちシーンバイアスに着目し,新しいシーン対応ビデオテキストアライメント手法を提案する。我々のキーとなる考え方は、映像表現とシーン符号化されたテキスト表現とを区別し、シーンに依存しないビデオ表現を学習し、ドメイン間のアクションを認識することである。
論文参考訳（メタデータ） (2024-03-03T16:48:16Z)
Free-Form Composition Networks for Egocentric Action Recognition [97.02439848145359]
本稿では,不整形動詞,前置詞,名詞表現を同時に学習できる自由形合成ネットワーク(FFCN)を提案する。提案したFFCNは、レアクラスのトレーニングデータを直接生成できるため、動作認識性能が大幅に向上する。
論文参考訳（メタデータ） (2023-07-13T02:22:09Z)
Learning to Refactor Action and Co-occurrence Features for Temporal Action Localization [74.74339878286935]
アクション機能と共起機能は、しばしばビデオの実際のアクションコンテンツを支配します。ビデオスニペット内でこれらの2種類の特徴を分離することで,新しい補助タスクを開発する。まず、アクション内容を明示的に分解し、その共起機能を正規化します。
論文参考訳（メタデータ） (2022-06-23T06:30:08Z)
E^2TAD: An Energy-Efficient Tracking-based Action Detector [78.90585878925545]
本稿では,事前定義されたキーアクションを高精度かつ効率的にローカライズするためのトラッキングベースソリューションを提案する。 UAV-Video Track of 2021 Low-Power Computer Vision Challenge (LPCVC)で優勝した。
論文参考訳（メタデータ） (2022-04-09T07:52:11Z)
Part-level Action Parsing via a Pose-guided Coarse-to-Fine Framework [108.70949305791201]
パートレベルのアクションパーシング(PAP)は、ビデオレベルのアクションを予測するだけでなく、ビデオ内の各人に対するフレームレベルのきめ細かいアクションやインタラクションを認識することを目的としている。特に,本フレームワークは,まず入力ビデオの映像レベルのクラスを予測し,次に身体部位をローカライズし,部分レベルの動作を予測する。我々のフレームワークは最先端のパフォーマンスを達成し、既存の手法を31.10%のROCスコアで上回ります。
論文参考訳（メタデータ） (2022-03-09T01:30:57Z)
Deep Learning-based Action Detection in Untrimmed Videos: A Survey [20.11911785578534]
ほとんどの現実世界のビデオは長く、興味をそそる部分がある。非トリミングビデオにおける時間的活動検出のタスクは、アクションの時間的境界をローカライズすることを目的としている。本稿では,非トリミングビデオにおける時間的行動検出のためのディープラーニングに基づくアルゴリズムの概要について述べる。
論文参考訳（メタデータ） (2021-09-30T22:42:25Z)
Weakly Supervised Temporal Action Localization Through Learning Explicit Subspaces for Action and Context [151.23835595907596]
ビデオレベルの監視のみの下で、アクションインスタンスの時間的開始と終了をローカライズする方法を学ぶ。アクションとコンテキストそれぞれについて,2つの機能サブスペースを学習するフレームワークを提案する。提案手法は3つのベンチマークで最先端のWS-TAL法より優れている。
論文参考訳（メタデータ） (2021-03-30T08:26:53Z)
SCT: Set Constrained Temporal Transformer for Set Supervised Action Segmentation [22.887397951846353]
弱教師付きアプローチは、弱ラベル付きビデオから時間的アクションセグメンテーションを学ぶことを目的としている。このようなデータに基づいてエンドツーエンドにトレーニング可能なアプローチを提案する。提案手法は,最先端の結果が得られる3つのデータセットに対して評価する。
論文参考訳（メタデータ） (2020-03-31T14:51:41Z)
Action Graphs: Weakly-supervised Action Localization with Graph Convolution Networks [25.342482374259017]
本稿では,グラフ畳み込みに基づく弱教師付き動作位置決め手法を提案する。本手法は外観と動きを符号化した類似性グラフを用いて,THUMOS '14, ActivityNet 1.2, Charadesの動作ローカライゼーションを弱めに制御する手法である。
論文参考訳（メタデータ） (2020-02-04T18:21:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。