論文の概要: Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics
- arxiv url: http://arxiv.org/abs/2603.04874v1
- Date: Thu, 05 Mar 2026 07:04:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-06 22:06:11.107556
- Title: Interpretable Pre-Release Baseball Pitch Type Anticipation from Broadcast 3D Kinematics
- Title(参考訳): 放送3Dキネマティックスによるプレリース野球ピッチ型予測
- Authors: Jerrin Bright, Michelle Lu, John Zelek,
- Abstract要約: 球飛行データにアクセスせずに、単眼の3Dポーズシーケンスから8種類のピッチタイプを分類する。
我々のパイプラインは、自動ピッチングイベント検出による拡散ベースの3Dポーズバックボーンをチェーンする。
119,561個のプロピッチでボディキネマティクスのみを用いて80.4%の精度を実現した。
- 参考スコア(独自算出の注目度): 3.1224081969539714
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: How much can a pitcher's body reveal about the upcoming pitch? We study this question at scale by classifying eight pitch types from monocular 3D pose sequences, without access to ball-flight data. Our pipeline chains a diffusion-based 3D pose backbone with automatic pitching-event detection, groundtruth-validated biomechanical feature extraction, and gradient-boosted classification over 229 kinematic features. Evaluated on 119,561 professional pitches, the largest such benchmark to date, we achieve 80.4\% accuracy using body kinematics alone. A systematic importance analysis reveals that upper-body mechanics contribute 64.9\% of the predictive signal versus 35.1\% for the lower body, with wrist position (14.8\%) and trunk lateral tilt emerging as the most informative joint group and biomechanical feature, respectively. We further show that grip-defined variants (four-seam vs.\ two-seam fastball) are not separable from pose, establishing an empirical ceiling near 80\% and delineating where kinematic information ends and ball-flight information begins.
- Abstract(参考訳): ピッチャーの体は、今後のピッチについてどのくらいの量を明らかにすることができますか。
本研究では,球飛行データにアクセスせずに,単眼の3次元ポーズ列から8種類のピッチタイプを分類し,大規模に研究する。
提案するパイプラインは, 自動ピッチングイベント検出, 接地型バイオメカニカル特徴抽出, および229個のキネマティック特徴に対する勾配型分類を含む, 拡散型3Dポーズバックボーンをチェーンする。
今までで最大の119,561のプロピッチで評価され、ボディキネマティクスだけで80.4\%の精度を達成した。
体系的な重要な分析により、上半身のメカニックが下半身の予測信号の64.9\%、下半身の35.1\%、手首の位置(14.8\%)と幹側傾がそれぞれ最も情報的な関節群および生体力学的特徴として現れることが明らかとなった。
さらに、グリップ定義の変種(4-seam vs。
2シームファストボール)はポーズとは分離できず、80%近くで経験的な天井を確立し、キネマティックな情報が終了し、ボールフライ情報が始まる場所を列挙する。
関連論文リスト
- Scalable Injury-Risk Screening in Baseball Pitching From Broadcast Video [2.994962964425238]
放送映像から臨床的に関連のある18のバイオメカニクス指標を回収する単眼ビデオパイプラインを提案する。
提案手法はDreamPose3Dをベースとして,骨盤軌道を回復するドリフト制御のグローバルリフトモジュールを導入する。
これらの指標をケガ予測に用いた自動スクリーニングモデルは、トミー・ジョン手術のAUC 0.811と、7,348ピッチャーの腕の重傷の0.825を達成している。
論文 参考訳(メタデータ) (2026-03-05T06:38:32Z) - Trace Anything: Representing Any Video in 4D via Trajectory Fields [98.85848134960172]
軌道場 (Trajectory Field) は、各フレーム内の各ピクセルに時間の連続した3次元軌跡関数を割り当てる密集写像である。
我々は,1つのフィードフォワードパスで軌道場全体を予測するニューラルネットワークであるTrace Anythingを紹介する。
私たちは、新しいプラットフォームからのデータを含む大規模な4Dデータに基づいて、Trace Anythingモデルをトレーニングしました。
論文 参考訳(メタデータ) (2025-10-15T17:59:04Z) - SpikeGrasp: A Benchmark for 6-DoF Grasp Pose Detection from Stereo Spike Streams [57.84331423686738]
ほとんどのロボットの把握システムは、センサーデータを明示的な3Dポイントの雲に変換することに依存しており、これは生物学的知性には見つからない計算ステップである。
生体振動子経路を模倣するフレームワークであるSpikeGraspを導入し、立体スパイクカメラから生の非同期イベントを処理する。
我々のモデルは、これらのステレオスパイクストリームを融合させ、高レベルの視覚処理に類似した繰り返しスパイクニューラルネットワークを使用して、点雲を再構築することなく、把握仮説を反復的に洗練する。
論文 参考訳(メタデータ) (2025-10-12T13:36:40Z) - AthleticsPose: Authentic Sports Motion Dataset on Athletic Field and Evaluation of Monocular 3D Pose Estimation Ability [4.991985467382602]
AthleticsPoseデータセットを導入し、運動場で様々なスポーツイベントを行う23人のアスリートからリアルの動きをキャプチャする。
その結果,AthleticsPoseでトレーニングしたモデルは,模擬スポーツ運動データセットでトレーニングしたベースラインモデルよりも有意に優れていた。
運動学的指標のケーススタディでは、このモデルは膝の角度の個人差をとらえる可能性を示したが、より高速な測定に苦慮した。
論文 参考訳(メタデータ) (2025-07-17T08:43:23Z) - AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements [4.653030985708889]
AthletePose3Dは、高速で高速な運動運動をキャプチャするために設計された、新しいデータセットである。
本研究では,SOTA (State-of-the-art monocular 2D and 3D pose Estimation model on the dataset。
論文 参考訳(メタデータ) (2025-03-10T16:16:02Z) - Estimating Body and Hand Motion in an Ego-sensed World [62.61989004520802]
頭部装着装置から人体の動きを推定するシステムであるEgoAlloについて述べる。
エゴセントリックなSLAMポーズとイメージのみを使用して、EgoAlloは条件付き拡散モデルからサンプリングを行い、3Dボディポーズ、高さ、手のパラメータを推定する。
論文 参考訳(メタデータ) (2024-10-04T17:59:57Z) - PitcherNet: Powering the Moneyball Evolution in Baseball Video Analytics [13.928557561312026]
PitcherNetは、生放送ビデオから直接ピッチャーキネマティクスを分析するエンドツーエンドの自動化システムである。
ピッチャー・トラックレットの識別では96.82%の精度で頑健な解析結果が得られる。
PitcherNetは、投球戦略を最適化し、怪我を防ぎ、投手のメカニックの深い理解を解き放つことによって、野球分析の未来への道を開く。
論文 参考訳(メタデータ) (2024-05-13T01:03:06Z) - Towards Single Camera Human 3D-Kinematics [15.559206592078425]
深層ニューラルネットワークを用いたビデオから直接3次元人体動推定D3KEを提案する。
実験により,提案したエンドツーエンドトレーニングは頑健であり,2次元および3次元マーカーレスモーションキャプチャに基づく運動推定パイプラインよりも優れていた。
論文 参考訳(メタデータ) (2023-01-13T08:44:09Z) - Tactile Grasp Refinement using Deep Reinforcement Learning and Analytic
Grasp Stability Metrics [70.65363356763598]
解析的把握安定性指標が強化学習アルゴリズムの強力な最適化目標であることを示す。
幾何的および力量に依存しないグリップ安定性の指標を組み合わせることで、カブイドの平均成功率は95.4%となることを示す。
第2の実験では,触覚情報を持たないベースラインよりも,接触フィードバックで訓練したグリップリファインメントアルゴリズムが最大6.6%向上することを示した。
論文 参考訳(メタデータ) (2021-09-23T09:20:19Z) - Neural Monocular 3D Human Motion Capture with Physical Awareness [76.55971509794598]
物理的に可塑性なマーカーレス3次元モーションキャプチャのための新しいトレーニングシステムを提案する。
人間のモーションキャプチャのためのほとんどのニューラルな手法とは異なり、我々のアプローチは物理的および環境的な制約を認識している。
様々な場面でインタラクティブなフレームレートで、滑らかで物理的に原理化された3dモーションを生成する。
論文 参考訳(メタデータ) (2021-05-03T17:57:07Z) - Contact and Human Dynamics from Monocular Video [73.47466545178396]
既存のディープモデルは、ほぼ正確に見えるエラーを含むビデオから2Dと3Dキネマティックのポーズを予測する。
本稿では,最初の2次元と3次元のポーズ推定を入力として,映像系列から3次元の人間の動きを推定する物理に基づく手法を提案する。
論文 参考訳(メタデータ) (2020-07-22T21:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。