Fugu-MT 論文翻訳(概要): Context-Aware 3D Object Localization from Single Calibrated Images: A Study of Basketballs

論文の概要: Context-Aware 3D Object Localization from Single Calibrated Images: A Study of Basketballs

arxiv url: http://arxiv.org/abs/2309.03640v1
Date: Thu, 7 Sep 2023 11:14:02 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-08 13:16:39.039493
Title: Context-Aware 3D Object Localization from Single Calibrated Images: A Study of Basketballs
Title（参考訳）: 単一校正画像からの文脈認識型3次元物体定位:バスケットボールの研究
Authors: Marcello Davide Caio (1), Gabriel Van Zandycke (1 and 2) and Christophe De Vleeschouwer (2) ((1) Sportradar AG, (2) UCLouvain)
Abstract要約: 単一校正画像から3次元バスケットボールのローカライズ手法を提案する。提案手法は,画像内の平面上に投影された物体の高さを推定することにより,画像空間内の物体の高さを推定する。ボールの3次元座標は、既知の投影行列を利用して再構成される。
参考スコア（独自算出の注目度）: 1.809206198141384
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Accurately localizing objects in three dimensions (3D) is crucial for various computer vision applications, such as robotics, autonomous driving, and augmented reality. This task finds another important application in sports analytics and, in this work, we present a novel method for 3D basketball localization from a single calibrated image. Our approach predicts the object's height in pixels in image space by estimating its projection onto the ground plane within the image, leveraging the image itself and the object's location as inputs. The 3D coordinates of the ball are then reconstructed by exploiting the known projection matrix. Extensive experiments on the public DeepSport dataset, which provides ground truth annotations for 3D ball location alongside camera calibration information for each image, demonstrate the effectiveness of our method, offering substantial accuracy improvements compared to recent work. Our work opens up new possibilities for enhanced ball tracking and understanding, advancing computer vision in diverse domains. The source code of this work is made publicly available at \url{https://github.com/gabriel-vanzandycke/deepsport}.
Abstract（参考訳）: 3次元の物体の正確な位置決め(3D)は、ロボティクス、自律運転、拡張現実など、さまざまなコンピュータビジョンアプリケーションに不可欠である。この課題はスポーツ分析におけるもう一つの重要な応用を見つけ,本研究では,単一校正画像から3次元バスケットボールのローカライゼーションを行う新しい手法を提案する。提案手法は,画像内の地上面への投影を推定し,画像自体と物体の位置を入力として利用することにより,画像空間における物体の高さを推定する。ボールの3次元座標は、既知の投影行列を利用して再構成される。画像毎にカメラキャリブレーション情報と合わせて3d球位置の地上真理アノテーションを提供するdeepsportデータセットに関する広範囲な実験を行い,最近の研究に比べて精度が大幅に向上することを示す。我々の研究は、ボール追跡と理解を強化し、多様な領域におけるコンピュータビジョンを前進させる新たな可能性を開く。この作業のソースコードは \url{https://github.com/gabriel-vanzandycke/deepsport} で公開されている。

関連論文リスト

3D Ground Truth Reconstruction from Multi-Camera Annotations Using UKF [4.898782241137317]
本稿では,UKF(Unscented Kalman Filter)を用いて2次元境界ボックスを融合させたり,キーポイント基底真理アノテーションを3次元基底真理に応用する新しい手法を提案する。提案手法は,ヒトのアノテートした接地トラス2Dを利用して,ホログラフィベースの投影とUKFベースの融合により,2次元画像座標をロバストな3次元世界座標に変換する。我々は,CMC,Wildtrack,Panopticの3次元局所化の精度を,利用可能な3次元地上真実と比較して高い精度で評価した。
論文参考訳（メタデータ） (2025-11-18T08:15:14Z)
Towards Scalable Spatial Intelligence via 2D-to-3D Data Lifting [64.64738535860351]
単一ビュー画像を包括的・スケール的・外観リアルな3D表現に変換するスケーラブルなパイプラインを提案する。本手法は,画像の膨大な保存と空間的シーン理解への需要の増大とのギャップを埋めるものである。画像から精度の高い3Dデータを自動的に生成することにより,データ収集コストを大幅に削減し,空間知性を向上するための新たな道を開く。
論文参考訳（メタデータ） (2025-07-24T14:53:26Z)
SoccerNet-v3D: Leveraging Sports Broadcast Replays for 3D Scene Understanding [16.278222277579655]
サッカー放送解析における3次元シーン理解のために設計された2つのデータセットであるサッカーネット-v3DとISSIA-3Dを紹介する。これらのデータセットは、フィールドラインベースのカメラキャリブレーションとマルチビュー同期を組み込むことで、 SoccerNet-v3 と ISSIA を拡張している。本研究では, 接地トラス2Dボールアノテーションの三角測量に基づいて, モノラルな3Dボール位置決めタスクを提案する。
論文参考訳（メタデータ） (2025-04-14T11:15:13Z)
AutoDecoding Latent 3D Diffusion Models [95.7279510847827]
本稿では,3次元オートデコーダをコアとした静的・明瞭な3次元アセットの生成に対して,新しいアプローチを提案する。 3D Autodecoderフレームワークは、ターゲットデータセットから学んだプロパティを潜時空間に埋め込む。次に、適切な中間体積潜在空間を特定し、ロバストな正規化と非正規化演算を導入する。
論文参考訳（メタデータ） (2023-07-07T17:59:14Z)
NeurOCS: Neural NOCS Supervision for Monocular 3D Object Localization [80.3424839706698]
入力として3Dボックスをインスタンスマスクとして使用するNeurOCSを提案する。われわれのアプローチは、実際の運転シーンから直接カテゴリレベルの形状を学習する際の洞察に依存している。我々は、オブジェクト中心の視点からオブジェクト座標をより効果的に学習するための重要な設計選択を行う。
論文参考訳（メタデータ） (2023-05-28T16:18:41Z)
SurroundOcc: Multi-Camera 3D Occupancy Prediction for Autonomous Driving [98.74706005223685]
3Dシーン理解は、視覚に基づく自動運転において重要な役割を果たす。マルチカメラ画像を用いたSurroundOcc法を提案する。
論文参考訳（メタデータ） (2023-03-16T17:59:08Z)
Learning 3D Object Shape and Layout without 3D Supervision [26.575177430506667]
3Dシーンはオブジェクトのセットで構成され、それぞれが空間における位置を与える形状とレイアウトを持つ。本研究では,物体の3次元形状とレイアウトを,地平面形状やレイアウト情報なしで予測する手法を提案する。我々のアプローチは、より小さく、より多様なデータセットで訓練された教師ありアプローチよりも優れています。
論文参考訳（メタデータ） (2022-06-14T17:49:44Z)
Ball 3D localization from a single calibrated image [1.2891210250935146]
本研究では,画素内の球径を推定し,実球径の知識をメートル単位で利用することにより,単一画像上の課題に対処することを提案する。このアプローチは、ボールが(部分的にも)見えるようなあらゆるゲーム状況に適しています。 3つのバスケットボールデータセットの検証により,我々のモデルがボール3Dのローカライゼーションに顕著な予測を与えることが明らかとなった。
論文参考訳（メタデータ） (2022-03-30T19:38:14Z)
Voxel-based 3D Detection and Reconstruction of Multiple Objects from a Single Image [22.037472446683765]
入力画像から3次元特徴持ち上げ演算子を用いて3次元シーン空間に整合した3次元ボクセル特徴の正規格子を学習する。この3Dボクセルの特徴に基づき,新しいCenterNet-3D検出ヘッドは3D空間におけるキーポイント検出として3D検出を定式化する。我々は、粗度ボキセル化や、新しい局所PCA-SDF形状表現を含む、効率的な粗度から細度の再構成モジュールを考案する。
論文参考訳（メタデータ） (2021-11-04T18:30:37Z)
3D-Aware Ellipse Prediction for Object-Based Camera Pose Estimation [3.103806775802078]
視聴条件に頑健な粗いカメラポーズ計算法を提案する。観察条件に関係なく、物体を確実に検出する深層学習技術を活用する。
論文参考訳（メタデータ） (2021-05-24T18:40:18Z)
Shape and Viewpoint without Keypoints [63.26977130704171]
本研究では,1枚の画像から3次元形状,ポーズ,テクスチャを復元する学習フレームワークを提案する。我々は,3次元形状,マルチビュー,カメラ視点,キーポイントの監督なしに画像収集を訓練した。我々は、最先端のカメラ予測結果を取得し、オブジェクト間の多様な形状やテクスチャを予測することを学べることを示す。
論文参考訳（メタデータ） (2020-07-21T17:58:28Z)
Kinematic 3D Object Detection in Monocular Video [123.7119180923524]
運動運動を注意深く利用して3次元位置決めの精度を向上させるモノクロ映像を用いた3次元物体検出法を提案する。我々は、KITTI自動運転データセット内のモノクロ3次元物体検出とバードアイビュータスクの最先端性能を達成する。
論文参考訳（メタデータ） (2020-07-19T01:15:12Z)
MoNet3D: Towards Accurate Monocular 3D Object Localization in Real Time [15.245372936153277]
MoNet3Dはモノクロ画像中の各オブジェクトの3D位置を予測し、各オブジェクトの3Dバウンディングボックスを描画する新しいフレームワークである。この手法は27.85FPSのリアルタイム画像処理を実現することができ、組込み先進運転支援システム応用の可能性を示している。
論文参考訳（メタデータ） (2020-06-29T12:48:57Z)
Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文参考訳（メタデータ） (2020-04-05T12:52:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。