論文の概要: Ball 3D localization from a single calibrated image
- arxiv url: http://arxiv.org/abs/2204.00003v1
- Date: Wed, 30 Mar 2022 19:38:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-04 15:25:25.766060
- Title: Ball 3D localization from a single calibrated image
- Title(参考訳): 単一校正画像からのボール3次元位置決め
- Authors: Gabriel Van Zandycke and Christophe De Vleeshouwer
- Abstract要約: 本研究では,画素内の球径を推定し,実球径の知識をメートル単位で利用することにより,単一画像上の課題に対処することを提案する。
このアプローチは、ボールが(部分的にも)見えるようなあらゆるゲーム状況に適しています。
3つのバスケットボールデータセットの検証により,我々のモデルがボール3Dのローカライゼーションに顕著な予測を与えることが明らかとなった。
- 参考スコア(独自算出の注目度): 1.2891210250935146
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Ball 3D localization in team sports has various applications including
automatic offside detection in soccer, or shot release localization in
basketball. Today, this task is either resolved by using expensive multi-views
setups, or by restricting the analysis to ballistic trajectories. In this work,
we propose to address the task on a single image from a calibrated monocular
camera by estimating ball diameter in pixels and use the knowledge of real ball
diameter in meters. This approach is suitable for any game situation where the
ball is (even partly) visible. To achieve this, we use a small neural network
trained on image patches around candidates generated by a conventional ball
detector. Besides predicting ball diameter, our network outputs the confidence
of having a ball in the image patch. Validations on 3 basketball datasets
reveals that our model gives remarkable predictions on ball 3D localization. In
addition, through its confidence output, our model improves the detection rate
by filtering the candidates produced by the detector. The contributions of this
work are (i) the first model to address 3D ball localization on a single image,
(ii) an effective method for ball 3D annotation from single calibrated images,
(iii) a high quality 3D ball evaluation dataset annotated from a single
viewpoint. In addition, the code to reproduce this research is be made freely
available at https://github.com/gabriel-vanzandycke/deepsport.
- Abstract(参考訳): チームスポーツにおけるボール3dローカライズには、サッカーにおける自動オフサイド検出、バスケットボールにおけるショットリリースローカライズなど様々な応用がある。
今日では、このタスクは高価なマルチビューの設定を使用することで解決するか、あるいは弾道軌道に分析を制限することによって解決される。
本研究では,画素の球径を推定し,実球径の知識をメートルで用いることで,校正単眼カメラからの単一画像の課題に対処することを提案する。
このアプローチは、ボールが(一部でも)見えるあらゆるゲーム状況に適している。
これを実現するために、従来のボール検出器が生成する候補の周囲に画像パッチをトレーニングした小さなニューラルネットワークを使用する。
我々のネットワークは,ボール径の予測に加えて,画像パッチにボールを持つ自信を出力する。
3つのバスケットボールデータセットの検証により,球の3次元位置推定に顕著な予測が得られた。
また,このモデルでは,検出者が生成する候補をフィルタリングすることで,検出率を向上させる。
この作品の貢献は
(i) 1枚の画像上で3Dボールのローカライゼーションに対処する最初のモデル。
(ii)単一キャリブレーション画像からのボール3dアノテーションの効果的な方法
(3)単一視点からアノテートした高品質な3Dボール評価データセット。
さらに、この研究を再現するコードはhttps://github.com/gabriel-vanzandycke/deepsportで無償公開されている。
関連論文リスト
- Enhancing Soccer Camera Calibration Through Keypoint Exploitation [0.0]
本稿では,高品質な点対を得るという課題に対処する多段階パイプラインを提案する。
本手法は,直線交点や直線-円錐交点,円錐上の点,その他の幾何学的特徴を活用することにより,校正に利用できる点の数を大幅に増加させる。
我々は,サッカー放送カメラのキャリブレーション・データセットの最大化について検討し,サッカーネットカメラチャレンジ2023でトップの地位を確保した。
論文 参考訳(メタデータ) (2024-10-09T20:01:14Z) - 3DiffTection: 3D Object Detection with Geometry-Aware Diffusion Features [70.50665869806188]
3DiffTectionは、単一の画像から3Dオブジェクトを検出する最先端の方法である。
拡散モデルを微調整し、単一の画像に条件付けされた新しいビュー合成を行う。
さらに、検出監視により、ターゲットデータ上でモデルをトレーニングする。
論文 参考訳(メタデータ) (2023-11-07T23:46:41Z) - Context-Aware 3D Object Localization from Single Calibrated Images: A
Study of Basketballs [1.809206198141384]
単一校正画像から3次元バスケットボールのローカライズ手法を提案する。
提案手法は,画像内の平面上に投影された物体の高さを推定することにより,画像空間内の物体の高さを推定する。
ボールの3次元座標は、既知の投影行列を利用して再構成される。
論文 参考訳(メタデータ) (2023-09-07T11:14:02Z) - Deep-Learning-Based Computer Vision Approach For The Segmentation Of
Ball Deliveries And Tracking In Cricket [4.021584094339975]
本稿では,ボールのみを届ける映像を分割抽出する手法を提案する。
オブジェクト検出モデルを適用して,映像を正確に抽出する手法を提案する。
これらのビデオショットにおけるボール追跡は、提案したデータセットの有用性のサンプルとして、別のRetinaNetモデルを使用して行われる。
論文 参考訳(メタデータ) (2022-11-22T04:55:58Z) - An Empirical Study of Pseudo-Labeling for Image-based 3D Object
Detection [72.30883544352918]
異なる条件下で,擬似ラベルがベースラインモデルに対して効果的に監視できるかどうかを検討する。
ベルとホイッスルを使わずにKITTI-3Dテストセットの適度なレベルを20.23 APで達成し、ベースラインモデルを6.03 APで改善した。
この研究が、半教師付き環境下で画像に基づく3D検出コミュニティに洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2022-08-15T12:17:46Z) - Object-Based Visual Camera Pose Estimation From Ellipsoidal Model and
3D-Aware Ellipse Prediction [2.016317500787292]
本稿では,1枚の画像から初期カメラのポーズ推定を行う手法を提案する。
観察条件に関係なく、物体を確実に検出する深層学習技術を活用する。
実験により,提案手法により計算結果の精度が著しく向上することが確認された。
論文 参考訳(メタデータ) (2022-03-09T10:00:52Z) - Tracking People by Predicting 3D Appearance, Location & Pose [78.97070307547283]
私たちはまず、1つのフレームから3Dまで、堅牢な方法で人々を持ち上げます。
人を追跡すると、時間とともに3Dの観察結果をトラックレット表現で収集する。
これらのモデルを用いて、トラックレットの将来状態を予測します。
論文 参考訳(メタデータ) (2021-12-08T18:57:15Z) - Efficient Golf Ball Detection and Tracking Based on Convolutional Neural
Networks and Kalman Filter [15.899498333913975]
畳み込みニューラルネットワーク(CNN)に基づく物体検出とカルマンフィルタに基づく予測を用いて,効率的なリアルタイムアプローチを提案する。
検出は小さい球の検出の性能を高めるために全体のイメージの代りに小さいイメージのパッチで行われます。
検出モデルを訓練し、追跡アルゴリズムをテストするために、ゴルフボールデータセットのコレクションを作成して注釈付けする。
論文 参考訳(メタデータ) (2020-12-17T04:55:27Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Kinematic 3D Object Detection in Monocular Video [123.7119180923524]
運動運動を注意深く利用して3次元位置決めの精度を向上させるモノクロ映像を用いた3次元物体検出法を提案する。
我々は、KITTI自動運転データセット内のモノクロ3次元物体検出とバードアイビュータスクの最先端性能を達成する。
論文 参考訳(メタデータ) (2020-07-19T01:15:12Z) - ZoomNet: Part-Aware Adaptive Zooming Neural Network for 3D Object
Detection [69.68263074432224]
ステレオ画像に基づく3D検出のためのZoomNetという新しいフレームワークを提案する。
ZoomNetのパイプラインは、通常の2Dオブジェクト検出モデルから始まり、左右のバウンディングボックスのペアを取得するために使用される。
さらに,RGB画像のテクスチャキューを多用し,より正確な異質度推定を行うため,適応ズームという概念的に真直ぐなモジュールを導入する。
論文 参考訳(メタデータ) (2020-03-01T17:18:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。