論文の概要: Enhancing Multi-Camera Gymnast Tracking Through Domain Knowledge Integration
- arxiv url: http://arxiv.org/abs/2511.16532v1
- Date: Thu, 20 Nov 2025 16:47:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-21 17:08:52.730768
- Title: Enhancing Multi-Camera Gymnast Tracking Through Domain Knowledge Integration
- Title(参考訳): ドメイン知識統合によるマルチカメラジャムナスト追跡の強化
- Authors: Fan Yang, Shigeyuki Odashima, Shoichi Masui, Ikuo Kusajima, Sosuke Yamao, Shan Jiang,
- Abstract要約: 本手法のロバスト性は, 既存手法よりも優れていることを示すとともに, 広範囲な実験により検証した。
本手法を応用した体操判定システムは,近年の体操世界選手権に応用されている。
- 参考スコア(独自算出の注目度): 5.277869450528015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a robust multi-camera gymnast tracking, which has been applied at international gymnastics championships for gymnastics judging. Despite considerable progress in multi-camera tracking algorithms, tracking gymnasts presents unique challenges: (i) due to space restrictions, only a limited number of cameras can be installed in the gymnastics stadium; and (ii) due to variations in lighting, background, uniforms, and occlusions, multi-camera gymnast detection may fail in certain views and only provide valid detections from two opposing views. These factors complicate the accurate determination of a gymnast's 3D trajectory using conventional multi-camera triangulation. To alleviate this issue, we incorporate gymnastics domain knowledge into our tracking solution. Given that a gymnast's 3D center typically lies within a predefined vertical plane during \revised{much of their} performance, we can apply a ray-plane intersection to generate coplanar 3D trajectory candidates for opposing-view detections. More specifically, we propose a novel cascaded data association (DA) paradigm that employs triangulation to generate 3D trajectory candidates when cross-view detections are sufficient, and resort to the ray-plane intersection when they are insufficient. Consequently, coplanar candidates are used to compensate for uncertain trajectories, thereby minimizing tracking failures. The robustness of our method is validated through extensive experimentation, demonstrating its superiority over existing methods in challenging scenarios. Furthermore, our gymnastics judging system, equipped with this tracking method, has been successfully applied to recent Gymnastics World Championships, earning significant recognition from the International Gymnastics Federation.
- Abstract(参考訳): 本稿では,体操競技の国際競技大会で採用されている,堅牢なマルチカメラ体操追跡について紹介する。
マルチカメラ追跡アルゴリズムの進歩にもかかわらず、体操選手の追跡は独特な課題を呈している。
(i)空間制限のため、体操競技場に設置できるカメラは限られており、
(二)照明、背景、制服、閉塞のバリエーションにより、複数カメラ体操検出は特定の視点で失敗し、2つの反対視点からのみ有効な検出を行うことができる。
これらの要因は、従来のマルチカメラ三角測量による体操選手の3次元軌跡の正確な決定を複雑にしている。
この問題を軽減するために,体操分野の知識をトラッキングソリューションに取り入れる。
体操選手の3D中心は、通常、修正された{much of their}パフォーマンスの間、予め定義された垂直平面内にあるので、光平面交叉を適用して、反対視点検出のためのコプラナー3D軌道候補を生成することができる。
具体的には,横方向検出が十分である場合に3次元軌跡候補を生成するために三角法を利用した新しいケースドデータアソシエーション(DA)パラダイムを提案する。
その結果、コプラナー候補は不確実な軌跡を補うために使用され、これにより追跡障害を最小限に抑えることができる。
提案手法のロバスト性は広範囲な実験により検証され, 挑戦シナリオにおける既存手法よりも優れていることを示す。
さらに,本手法を応用した体操判定システムは,近年の体操世界選手権にも適用され,国際体操連盟から大きな評価を受けている。
関連論文リスト
- Multi-person Physics-based Pose Estimation for Combat Sports [0.689728655482787]
スパースマルチカメラを用いた戦闘スポーツにおける正確な3次元ポーズ推定のための新しい枠組みを提案する。
提案手法は,トランスフォーマーを用いたトップダウン手法により,堅牢なマルチビュー2Dポーズトラッキングを実現する。
我々はさらに、多対人物理に基づく軌道最適化のステップを導入することにより、ポーズリアリズムとロバスト性をさらに強化する。
論文 参考訳(メタデータ) (2025-04-11T00:08:14Z) - Lifting Multi-View Detection and Tracking to the Bird's Eye View [5.679775668038154]
マルチビュー検出と3Dオブジェクト認識の最近の進歩により、性能が大幅に向上した。
パラメータフリーとパラメータ化の両方の現代的なリフト法とマルチビューアグリゲーションを比較した。
堅牢な検出を学習するために,複数のステップの特徴を集約するアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-03-19T09:33:07Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - An Effective Motion-Centric Paradigm for 3D Single Object Tracking in
Point Clouds [50.19288542498838]
LiDARポイントクラウド(LiDAR SOT)における3Dシングルオブジェクトトラッキングは、自動運転において重要な役割を果たす。
現在のアプローチはすべて、外観マッチングに基づくシームズパラダイムに従っている。
我々は新たな視点からLiDAR SOTを扱うための動き中心のパラダイムを導入する。
論文 参考訳(メタデータ) (2023-03-21T17:28:44Z) - On Triangulation as a Form of Self-Supervision for 3D Human Pose
Estimation [57.766049538913926]
ラベル付きデータが豊富である場合, 単一画像からの3次元ポーズ推定に対する改良されたアプローチは, 極めて効果的である。
最近の注目の多くは、セミと(あるいは)弱い教師付き学習に移行している。
本稿では,多視点の幾何学的制約を,識別可能な三角測量を用いて課し,ラベルがない場合の自己監督の形式として用いることを提案する。
論文 参考訳(メタデータ) (2022-03-29T19:11:54Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Training-free Monocular 3D Event Detection System for Traffic
Surveillance [93.65240041833319]
既存のイベント検出システムは、主に学習ベースであり、大量のトレーニングデータが利用可能な場合、十分なパフォーマンスを実現している。
現実のシナリオでは、十分なラベル付きトレーニングデータの収集は高価であり、時には不可能である。
本稿では,交通監視のためのトレーニング不要な単眼3Dイベント検出システムを提案する。
論文 参考訳(メタデータ) (2020-02-01T04:42:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。