論文の概要: Decoupling Video and Human Motion: Towards Practical Event Detection in
Athlete Recordings
- arxiv url: http://arxiv.org/abs/2004.09776v2
- Date: Wed, 22 Apr 2020 15:52:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 07:06:10.056706
- Title: Decoupling Video and Human Motion: Towards Practical Event Detection in
Athlete Recordings
- Title(参考訳): 映像と人間の動作の分離:アスリート記録における実用的なイベント検出に向けて
- Authors: Moritz Einfalt, Rainer Lienhart
- Abstract要約: 本稿では,映像情報から人間の動きを分離する中間表現として2次元人間のポーズシーケンスを提案する。
本稿では,ポーズシーケンスにおける事象検出の2つのアプローチを解説し,それを補完領域である水泳と運動の2つで評価する。
提案手法はこれらの領域に限らず,ポーズに基づく動作イベント検出の柔軟性を示す。
- 参考スコア(独自算出の注目度): 33.770877823910176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we address the problem of motion event detection in athlete
recordings from individual sports. In contrast to recent end-to-end approaches,
we propose to use 2D human pose sequences as an intermediate representation
that decouples human motion from the raw video information. Combined with
domain-adapted athlete tracking, we describe two approaches to event detection
on pose sequences and evaluate them in complementary domains: swimming and
athletics. For swimming, we show how robust decision rules on pose statistics
can detect different motion events during swim starts, with a F1 score of over
91% despite limited data. For athletics, we use a convolutional sequence model
to infer stride-related events in long and triple jump recordings, leading to
highly accurate detections with 96% in F1 score at only +/- 5ms temporal
deviation. Our approach is not limited to these domains and shows the
flexibility of pose-based motion event detection.
- Abstract(参考訳): 本稿では,個人スポーツ記録における運動事象検出の問題点について述べる。
近年のエンド・ツー・エンドのアプローチとは対照的に,映像情報から人間の動きを分離する中間表現として,2次元のポーズシーケンスを用いることを提案する。
ドメイン適応型アスリートトラッキングと組み合わせることで,ポーズシーケンスのイベント検出と,水泳と運動という相補的な領域での評価を行う2つのアプローチについて述べる。
水泳では、データに制限があるにもかかわらず、F1スコアが91%を超え、スイミング開始時の異なる動きイベントを検出するために、ポーズ統計の頑健な決定ルールがいかに堅牢であるかを示す。
運動選手に対しては,ストライド関連事象を長時間・3回のジャンプ記録で推定するために畳み込みシーケンスモデルを用い,F1スコアの96%を時間差+/-5msで高精度に検出した。
本手法はこれらの領域に限らず,ポーズに基づく動作イベント検出の柔軟性を示す。
関連論文リスト
- SportsSloMo: A New Benchmark and Baselines for Human-centric Video Frame
Interpolation [11.198172694893927]
SportsSloMoは、130万本以上のビデオクリップと100万フレームの高解像度(720p)のスローモーションスポーツビデオがYouTubeからクロールされたベンチマークである。
ベンチマークでいくつかの最先端手法を再学習し、その結果、他のデータセットと比較して精度が低下していることを示す。
我々は,人間の認識する先行性を考慮した2つの損失項を導入し,汎視的セグメンテーションと人間のキーポイント検出に補助的監督を加える。
論文 参考訳(メタデータ) (2023-08-31T17:23:50Z) - Bridging the Gap between Events and Frames through Unsupervised Domain
Adaptation [57.22705137545853]
本稿では,ラベル付き画像とラベル付きイベントデータを用いてモデルを直接訓練するタスク転送手法を提案する。
生成イベントモデルを利用して、イベント機能をコンテンツとモーションに分割します。
われわれのアプローチは、イベントベースのニューラルネットワークのトレーニングのために、膨大な量の既存の画像データセットをアンロックする。
論文 参考訳(メタデータ) (2021-09-06T17:31:37Z) - EventHPE: Event-based 3D Human Pose and Shape Estimation [33.197194879047956]
イベントカメラは、イベントとして動く物体のダイナミックスをキャプチャする、新しいイメージングセンサーである。
本研究では,EventHPEと呼ばれる2段階のディープラーニング手法を提案する。
最初のステージであるFlowNetは、教師なしの学習によってトレーニングされ、イベントから光学フローを推論する。
第2段のShapeNetは、第2段のShapeNetへの入力として供給され、3次元の人間の形状を推定する。
論文 参考訳(メタデータ) (2021-08-15T21:40:19Z) - Multi-level Motion Attention for Human Motion Prediction [132.29963836262394]
本研究は, 関節, 身体部分, フルポーズレベルなど, 異なる種類の注意力の使用について検討した。
我々は,Human3.6M,AMASS,3DPWを用いて,周期的および非周期的両方の行動に対するアプローチの利点を検証した。
論文 参考訳(メタデータ) (2021-06-17T08:08:11Z) - History Repeats Itself: Human Motion Prediction via Motion Attention [81.94175022575966]
注意に基づくフィードフォワードネットワークを導入し、人間の動きが自分自身を繰り返す傾向にあるという観察を明示的に活用する。
特に,現在動きのコンテキストと過去の動きのサブシーケンスの類似性を捉えるために,動きの注意を抽出することを提案する。
我々は,Human3.6M,AMASS,3DPWを用いて,周期的および非周期的両方の行動に対するアプローチの利点を実証した。
論文 参考訳(メタデータ) (2020-07-23T02:12:27Z) - Contact and Human Dynamics from Monocular Video [73.47466545178396]
既存のディープモデルは、ほぼ正確に見えるエラーを含むビデオから2Dと3Dキネマティックのポーズを予測する。
本稿では,最初の2次元と3次元のポーズ推定を入力として,映像系列から3次元の人間の動きを推定する物理に基づく手法を提案する。
論文 参考訳(メタデータ) (2020-07-22T21:09:11Z) - Fusing Motion Patterns and Key Visual Information for Semantic Event
Recognition in Basketball Videos [87.29451470527353]
バスケットボールビデオのセマンティックイベント認識のために,グローバル・ローカル・モーション・パターン(MP)とキー視覚情報(KVI)を融合する手法を提案する。
カメラ調整の本質的特性に基づいて, 混合運動から大域的な動きを推定するアルゴリズムを提案する。
グローバル・ローカル・モーション・パターンを分離した2ストリーム3D CNNフレームワークを用いてグループ活動認識を行う。
論文 参考訳(メタデータ) (2020-07-13T10:15:44Z) - Event detection in coarsely annotated sports videos via parallel multi
receptive field 1D convolutions [14.30009544149561]
スポーツビデオ分析のような問題では、正確なフレームレベルのアノテーションと正確なイベント時間を得るのは難しい。
粗い注釈付きビデオにおけるイベント検出の課題を提案する。
本稿では,提案課題に対する多層時間畳み込みネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-13T19:51:25Z) - Unsupervised Temporal Feature Aggregation for Event Detection in
Unstructured Sports Videos [10.230408415438966]
任意のカメラアングルを持つ非構造化環境を対象としたスポーツビデオにおけるイベント検出事例について検討した。
我々は、非構造化設定におけるプレイヤーの教師なし識別と、任意の射撃角度によるバリエーションを示すために訓練されたモデルの一般化の2つの主要な問題を同定し、解決する。
論文 参考訳(メタデータ) (2020-02-19T10:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。