論文の概要: Uplifting Table Tennis: A Robust, Real-World Application for 3D Trajectory and Spin Estimation
- arxiv url: http://arxiv.org/abs/2511.20250v1
- Date: Tue, 25 Nov 2025 12:25:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.449259
- Title: Uplifting Table Tennis: A Robust, Real-World Application for 3D Trajectory and Spin Estimation
- Title(参考訳): 昇降テーブルテニス:3次元軌道とスピン推定のためのロバストで実世界の応用
- Authors: Daniel Kienzle, Katja Ludwig, Julian Lorenz, Shin'ichi Satoh, Rainer Lienhart,
- Abstract要約: 本稿では,この問題をフロントエンド認識タスクとバックエンド2D-to-3Dアップリフトタスクに分割する新しい2段階パイプラインを提案する。
ボール検出器とテーブルキーポイント検出器を組み合わせることにより,概念実証法を実用的で堅牢で高性能なエンド・ツー・エンド・エンド・アプリケーションに変換する。
- 参考スコア(独自算出の注目度): 32.884975524869084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Obtaining the precise 3D motion of a table tennis ball from standard monocular videos is a challenging problem, as existing methods trained on synthetic data struggle to generalize to the noisy, imperfect ball and table detections of the real world. This is primarily due to the inherent lack of 3D ground truth trajectories and spin annotations for real-world video. To overcome this, we propose a novel two-stage pipeline that divides the problem into a front-end perception task and a back-end 2D-to-3D uplifting task. This separation allows us to train the front-end components with abundant 2D supervision from our newly created TTHQ dataset, while the back-end uplifting network is trained exclusively on physically-correct synthetic data. We specifically re-engineer the uplifting model to be robust to common real-world artifacts, such as missing detections and varying frame rates. By integrating a ball detector and a table keypoint detector, our approach transforms a proof-of-concept uplifting method into a practical, robust, and high-performing end-to-end application for 3D table tennis trajectory and spin analysis.
- Abstract(参考訳): 通常のモノクラービデオからテーブルテニスボールの正確な3D動作を取得することは難しい問題であり、合成データで訓練された既存の方法は、現実の騒々しい、不完全なボールやテーブル検出に一般化する。
これは主に、現実世界のビデオに3Dの真実の軌跡やスピンアノテーションが欠如していることによる。
そこで本研究では,この問題をフロントエンド認識タスクとバックエンド2D-to-3Dアップリフトタスクに分割する,新しい2段階パイプラインを提案する。
この分離により、新たに作成したTTHQデータセットから、豊富な2D監視を備えたフロントエンドコンポーネントをトレーニングすることが可能になります。
具体的には、アップリフトモデルを再設計して、検出の欠如やフレームレートの変化など、一般的な現実世界のアーティファクトに対して堅牢なものにします。
ボール検出器とテーブルキーポイント検出器を組み合わせることで,概念アップリフト法を実用的で堅牢かつ高性能な3次元テーブルテニストラジェクトリおよびスピン解析用エンド・ツー・エンド・エンド・アプリケーションに変換する。
関連論文リスト
- Where Is The Ball: 3D Ball Trajectory Estimation From 2D Monocular Tracking [10.237629959021875]
2次元追跡シーケンスから3次元球軌道推定法を提案する。
本手法は,シミュレーションデータのみを訓練しながら,最先端の性能を実現する。
本手法は,スポーツ分析や仮想リプレイにおける様々な応用を開放し,複数の軌跡を持つ実世界のシナリオに一般化することができる。
論文 参考訳(メタデータ) (2025-06-06T05:42:05Z) - TT3D: Table Tennis 3D Reconstruction [11.84899291358663]
本稿では,オンライン卓球記録から正確な3次元球軌道を再構築するための新しい手法を提案する。
本手法は, ボールの飛来軌道の再投射誤差を最小限に抑えるバウンス状態を特定するために, ボールの運動の基盤となる物理を利用する。
我々のアプローチの重要な利点は、人間のポーズ推定やラケット追跡に頼ることなく、ボールスピンを推論できることである。
論文 参考訳(メタデータ) (2025-04-14T09:37:47Z) - Lift3D Foundation Policy: Lifting 2D Large-Scale Pretrained Models for Robust 3D Robotic Manipulation [30.744137117668643]
Lift3Dは、ロバストな3D操作ポリシーを構築するために、暗黙的で明示的な3Dロボット表現で2Dファンデーションモデルを強化するフレームワークである。
実験では、Lift3Dはいくつかのシミュレーションベンチマークや実世界のシナリオで、最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2024-11-27T18:59:52Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm [111.16358607889609]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。
PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文 参考訳(メタデータ) (2023-10-12T17:59:57Z) - Kinematic 3D Object Detection in Monocular Video [123.7119180923524]
運動運動を注意深く利用して3次元位置決めの精度を向上させるモノクロ映像を用いた3次元物体検出法を提案する。
我々は、KITTI自動運転データセット内のモノクロ3次元物体検出とバードアイビュータスクの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-07-19T01:15:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。