論文の概要: Mitigating Motion Blur for Robust 3D Baseball Player Pose Modeling for
Pitch Analysis
- arxiv url: http://arxiv.org/abs/2309.01010v1
- Date: Sat, 2 Sep 2023 19:42:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 23:48:31.216111
- Title: Mitigating Motion Blur for Robust 3D Baseball Player Pose Modeling for
Pitch Analysis
- Title(参考訳): ピッチ解析のためのロバスト3次元野球選手ポースモデリングのための動作ブラジャーの緩和
- Authors: Jerrin Bright, Yuhao Chen, John Zelek
- Abstract要約: 本稿では, ピッチャーのぼやけた動作に対処するモデルの能力を高めるために, 合成データ拡張パイプラインを提案する。
2次元と3次元のポーズ推定のためのテストデータセットにおいて、損失の54.2%と36.2%の顕著な減少が観察された。
- 参考スコア(独自算出の注目度): 5.010690651107531
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Using videos to analyze pitchers in baseball can play a vital role in
strategizing and injury prevention. Computer vision-based pose analysis offers
a time-efficient and cost-effective approach. However, the use of accessible
broadcast videos, with a 30fps framerate, often results in partial body motion
blur during fast actions, limiting the performance of existing pose keypoint
estimation models. Previous works have primarily relied on fixed backgrounds,
assuming minimal motion differences between frames, or utilized multiview data
to address this problem. To this end, we propose a synthetic data augmentation
pipeline to enhance the model's capability to deal with the pitcher's blurry
actions. In addition, we leverage in-the-wild videos to make our model robust
under different real-world conditions and camera positions. By carefully
optimizing the augmentation parameters, we observed a notable reduction in the
loss by 54.2% and 36.2% on the test dataset for 2D and 3D pose estimation
respectively. By applying our approach to existing state-of-the-art pose
estimators, we demonstrate an average improvement of 29.2%. The findings
highlight the effectiveness of our method in mitigating the challenges posed by
motion blur, thereby enhancing the overall quality of pose estimation.
- Abstract(参考訳): 野球のピッチャーの分析にビデオを使うことは、ストラテジジングとケガ予防に重要な役割を果たす。
コンピュータビジョンに基づくポーズ分析は、時間効率とコスト効率のよいアプローチを提供する。
しかし、30fpsのフレームレートを持つアクセス可能なブロードキャストビデオを使用することで、高速動作中に身体の一部動きがぼやけ、既存のポーズキーポイント推定モデルの性能が制限されることが多い。
以前の作品は主に固定された背景に依存しており、フレーム間の動きの差を最小にするか、マルチビューデータを使用してこの問題に対処していた。
そこで本研究では,ピッチャーのぼやけた動作に対処するモデルの能力を高めるために,合成データ拡張パイプラインを提案する。
さらに私たちは,実世界の状況やカメラ位置の異なる状況下で,モデルを堅牢にするために,wild内ビデオを活用しています。
拡張パラメータを慎重に最適化することにより、2Dと3Dのポーズ推定のためのテストデータセットにおいて、損失が54.2%減少し、36.2%減少した。
既存のポーズ推定にアプローチを適用することで、平均的な改善率は29.2%である。
本研究は,動きのぼけによる課題を軽減し,ポーズ推定の総合的品質を向上させる手法の有効性を強調する。
関連論文リスト
- Gait Recognition from Highly Compressed Videos [3.1049440318608568]
一般的な緩和戦略は、頑健性を改善するためにノイズデータ上の微調整ポーズ推定モデルを含む。
本稿では,監視映像の事前処理と改善を目的としたタスク対象のアーティファクト修正モデルを組み込んだ処理パイプラインを提案する。
本実験は歩行解析性能の向上を図り,提案手法の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2024-04-18T13:46:16Z) - Gaussian Splatting on the Move: Blur and Rolling Shutter Compensation for Natural Camera Motion [25.54868552979793]
本稿では,カメラの動きに適応し,手持ち映像データを用いた高品質なシーン再構成を実現する手法を提案する。
合成データと実データの両方を用いて、既存の手法よりもカメラの動きを軽減できる性能を示した。
論文 参考訳(メタデータ) (2024-03-20T06:19:41Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - Sample Less, Learn More: Efficient Action Recognition via Frame Feature
Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。
提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文 参考訳(メタデータ) (2023-07-27T13:52:42Z) - Kinematic-aware Hierarchical Attention Network for Human Pose Estimation
in Videos [17.831839654593452]
従来の人間のポーズ推定手法は, 連続するフレームの特徴を活用することで, 有望な結果を示した。
ほとんどのアプローチでは、ジッターに精度を妥協し、人間の動きの時間的側面を理解しない。
キネマティックなキーポイント機能を利用するアーキテクチャを設計する。
論文 参考訳(メタデータ) (2022-11-29T01:46:11Z) - Motion-from-Blur: 3D Shape and Motion Estimation of Motion-blurred
Objects in Videos [115.71874459429381]
本研究では,映像から3次元の運動,3次元の形状,および高度に動きやすい物体の外観を同時推定する手法を提案する。
提案手法は, 高速移動物体の劣化と3次元再構成において, 従来の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-29T11:25:14Z) - Learning to Segment Rigid Motions from Two Frames [72.14906744113125]
本研究では, 運動場から独立物体の動きを復元する幾何学的解析により, モジュラーネットワークを提案する。
2つの連続フレームを入力とし、背景のセグメンテーションマスクと複数の剛体移動オブジェクトを予測し、3次元の剛体変換によってパラメータ化する。
本手法はkittiおよびsintelにおける剛体運動セグメンテーションの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-11T04:20:30Z) - Towards Accurate Human Pose Estimation in Videos of Crowded Scenes [134.60638597115872]
我々は、時間的文脈を利用して新しいデータを収集する視点から、混雑したシーンのビデオにおける人間のポーズ推定を改善することに注力する。
あるフレームについては、過去のフレームから過去のポーズを転送し、その後のフレームから現在のフレームへ未来的なポーズを後退させ、ビデオにおける安定した人間のポーズ推定に繋がる。
このようにして、HIEチャレンジのテストデータセット上で、13本中7本、56.33本の平均w_APで最高の性能を達成する。
論文 参考訳(メタデータ) (2020-10-16T13:19:11Z) - Self-Supervised 3D Human Pose Estimation via Part Guided Novel Image
Synthesis [72.34794624243281]
ラベルのないビデオフレームからバリエーションを分離する自己教師付き学習フレームワークを提案する。
3Dポーズと空間部分マップの表現ギャップを埋める、微分可能な形式化により、多様なカメラの動きを持つビデオで操作できる。
論文 参考訳(メタデータ) (2020-04-09T07:55:01Z) - Prior-enlightened and Motion-robust Video Deblurring [29.158836861982742]
PriOr-enlightened and MOTION-robust deblurring model (PROMOTION) は難解なぼかしに適したモデルである。
我々は、異種先行情報を効率的に符号化するために、3Dグループ畳み込みを用いる。
また、一様でないぼやけた時間領域をよりよく扱うために、ぼやけた分布を表す事前設計を行う。
論文 参考訳(メタデータ) (2020-03-25T04:16:56Z) - Synergetic Reconstruction from 2D Pose and 3D Motion for Wide-Space
Multi-Person Video Motion Capture in the Wild [3.0015034534260665]
マルチカメラの精度と滑らかさを考慮したマーカーレスモーションキャプチャ手法を提案する。
提案手法は,各人物の3Dポーズを予測し,マルチカメラ画像のバウンディングボックスを決定する。
提案手法を,様々なデータセットと実スポーツフィールドを用いて評価した。
論文 参考訳(メタデータ) (2020-01-16T02:14:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。