論文の概要: SoccerNet-v3D: Leveraging Sports Broadcast Replays for 3D Scene Understanding
- arxiv url: http://arxiv.org/abs/2504.10106v1
- Date: Mon, 14 Apr 2025 11:15:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:54:51.108098
- Title: SoccerNet-v3D: Leveraging Sports Broadcast Replays for 3D Scene Understanding
- Title(参考訳): SoccerNet-v3D:3Dシーン理解のためのスポーツ放送リプレイの活用
- Authors: Marc Gutiérrez-Pérez, Antonio Agudo,
- Abstract要約: サッカー放送解析における3次元シーン理解のために設計された2つのデータセットであるサッカーネット-v3DとISSIA-3Dを紹介する。
これらのデータセットは、フィールドラインベースのカメラキャリブレーションとマルチビュー同期を組み込むことで、 SoccerNet-v3 と ISSIA を拡張している。
本研究では, 接地トラス2Dボールアノテーションの三角測量に基づいて, モノラルな3Dボール位置決めタスクを提案する。
- 参考スコア(独自算出の注目度): 16.278222277579655
- License:
- Abstract: Sports video analysis is a key domain in computer vision, enabling detailed spatial understanding through multi-view correspondences. In this work, we introduce SoccerNet-v3D and ISSIA-3D, two enhanced and scalable datasets designed for 3D scene understanding in soccer broadcast analysis. These datasets extend SoccerNet-v3 and ISSIA by incorporating field-line-based camera calibration and multi-view synchronization, enabling 3D object localization through triangulation. We propose a monocular 3D ball localization task built upon the triangulation of ground-truth 2D ball annotations, along with several calibration and reprojection metrics to assess annotation quality on demand. Additionally, we present a single-image 3D ball localization method as a baseline, leveraging camera calibration and ball size priors to estimate the ball's position from a monocular viewpoint. To further refine 2D annotations, we introduce a bounding box optimization technique that ensures alignment with the 3D scene representation. Our proposed datasets establish new benchmarks for 3D soccer scene understanding, enhancing both spatial and temporal analysis in sports analytics. Finally, we provide code to facilitate access to our annotations and the generation pipelines for the datasets.
- Abstract(参考訳): スポーツビデオ分析はコンピュータビジョンの重要な領域であり、多視点対応を通して詳細な空間理解を可能にする。
本研究では,サッカー放送解析における3次元シーン理解のために設計された2つの拡張および拡張性のあるデータセットである SoccerNet-v3D と ISSIA-3D を紹介する。
これらのデータセットは、フィールドラインベースのカメラキャリブレーションとマルチビュー同期を導入し、トライアングルによる3Dオブジェクトのローカライゼーションを可能にすることで、 SoccerNet-v3とISSIAを拡張している。
そこで本研究では,地中2次元ボールアノテーションの三角測量に基づくモノラルな3次元ボールローカライゼーションタスクと,必要に応じてアノテーションの品質を評価するためのキャリブレーションと再投影の指標を提案する。
さらに, カメラキャリブレーションとボールサイズを利用して, 球の位置を単眼で推定する, 単一像の3Dボール位置定位法を提案する。
さらに2次元アノテーションを洗練するために,3次元シーン表現との整合性を保証するバウンディングボックス最適化手法を導入する。
提案したデータセットは,3次元サッカーシーン理解のための新しいベンチマークを構築し,スポーツ分析における空間的および時間的分析の強化を図る。
最後に、アノテーションへのアクセスを容易にするコードとデータセットの生成パイプラインを提供します。
関連論文リスト
- CVCP-Fusion: On Implicit Depth Estimation for 3D Bounding Box Prediction [2.0375637582248136]
Cross-View Center Point-Fusionは、3Dオブジェクト検出を行う最先端モデルである。
我々のアーキテクチャは、以前に確立されたアルゴリズム、クロスビュートランスフォーマー、CenterPointのアスペクトを利用する。
論文 参考訳(メタデータ) (2024-10-15T02:55:07Z) - TAPVid-3D: A Benchmark for Tracking Any Point in 3D [63.060421798990845]
我々は,3Dにおける任意の点の追跡作業を評価するための新しいベンチマークTAPVid-3Dを導入する。
このベンチマークは、モノクロビデオから正確な3Dの動きと表面の変形を理解する能力を改善するためのガイドポストとして機能する。
論文 参考訳(メタデータ) (2024-07-08T13:28:47Z) - AutoSoccerPose: Automated 3D posture Analysis of Soccer Shot Movements [0.8009842832476994]
本稿では,サッカー中継ビデオにおける3Dショット姿勢(3DSP)データセットについて紹介する。
また、3DSP-GRAE(Graph Recurrent AutoEncoder)モデルを提案する。
完全な自動化を実現することは難しかったが、基本となるベースラインを提供し、アノテーション付きデータを超えてそのユーティリティを拡張した。
論文 参考訳(メタデータ) (2024-05-20T14:40:26Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - Context-Aware 3D Object Localization from Single Calibrated Images: A
Study of Basketballs [1.809206198141384]
単一校正画像から3次元バスケットボールのローカライズ手法を提案する。
提案手法は,画像内の平面上に投影された物体の高さを推定することにより,画像空間内の物体の高さを推定する。
ボールの3次元座標は、既知の投影行列を利用して再構成される。
論文 参考訳(メタデータ) (2023-09-07T11:14:02Z) - AutoDecoding Latent 3D Diffusion Models [95.7279510847827]
本稿では,3次元オートデコーダをコアとした静的・明瞭な3次元アセットの生成に対して,新しいアプローチを提案する。
3D Autodecoderフレームワークは、ターゲットデータセットから学んだプロパティを潜時空間に埋め込む。
次に、適切な中間体積潜在空間を特定し、ロバストな正規化と非正規化演算を導入する。
論文 参考訳(メタデータ) (2023-07-07T17:59:14Z) - Generating Visual Spatial Description via Holistic 3D Scene
Understanding [88.99773815159345]
視覚空間記述(VSD)は、画像内の対象物の空間的関係を記述するテキストを生成することを目的としている。
外部の3Dシーン抽出器を用いて,入力画像の3Dオブジェクトとシーン特徴を抽出する。
対象物の中心となる3次元空間シーングラフ(Go3D-S2G)を構築し,対象物の空間意味を総合的な3次元シーン内にモデル化する。
論文 参考訳(メタデータ) (2023-05-19T15:53:56Z) - CMR3D: Contextualized Multi-Stage Refinement for 3D Object Detection [57.44434974289945]
本稿では,3次元オブジェクト検出(CMR3D)フレームワークのためのコンテキスト型マルチステージリファインメントを提案する。
我々のフレームワークは3Dシーンを入力として取り、シーンの有用なコンテキスト情報を明示的に統合しようと試みている。
3Dオブジェクトの検出に加えて,3Dオブジェクトカウント問題に対するフレームワークの有効性について検討する。
論文 参考訳(メタデータ) (2022-09-13T05:26:09Z) - Ball 3D localization from a single calibrated image [1.2891210250935146]
本研究では,画素内の球径を推定し,実球径の知識をメートル単位で利用することにより,単一画像上の課題に対処することを提案する。
このアプローチは、ボールが(部分的にも)見えるようなあらゆるゲーム状況に適しています。
3つのバスケットボールデータセットの検証により,我々のモデルがボール3Dのローカライゼーションに顕著な予測を与えることが明らかとなった。
論文 参考訳(メタデータ) (2022-03-30T19:38:14Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。