論文の概要: AI Driven Soccer Analysis Using Computer Vision
- arxiv url: http://arxiv.org/abs/2604.08722v1
- Date: Thu, 09 Apr 2026 19:19:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.557046
- Title: AI Driven Soccer Analysis Using Computer Vision
- Title(参考訳): コンピュータビジョンを用いたAI駆動サッカー解析
- Authors: Adrian Manchado, Tanner Cellio, Jonathan Keane, Yiyang Wang,
- Abstract要約: ゲーム中におけるプレーヤの位置を予測するためのオブジェクト検出とトラッキングシステムを提案する。
プレーヤー識別モデルでは, YOLO や Faster R-CNN などのオブジェクト検出モデルを, カスタム映像の精度に基づいて評価する。
トランスフォーメーションされた現実世界の座標は、プレイヤーの速度、距離のカバー、位置のヒートマップなど、貴重な戦術的洞察を計算するのに使うことができる。
- 参考スコア(独自算出の注目度): 4.43478021647909
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sport analysis is crucial for team performance since it provides actionable data that can inform coaching decisions, improve player performance, and enhance team strategies. To analyze more complex features from game footage, a computer vision model can be used to identify and track key entities from the field. We propose the use of an object detection and tracking system to predict player positioning throughout the game. To translate this to positioning in relation to the field dimensions, we use a point prediction model to identify key points on the field and combine these with known field dimensions to extract actual distances. For the player-identification model, object detection models like YOLO and Faster R-CNN are evaluated on the accuracy of our custom video footage using multiple different evaluation metrics. The goal is to identify the best model for object identification to obtain the most accurate results when paired with SAM2 (Segment Anything Model 2) for segmentation and tracking. For the key point detection model, we use a CNN model to find consistent locations in the soccer field. Through homography, the positions of points and objects in the camera perspective will be transformed to a real-ground perspective. The segmented player masks from SAM2 are transformed from camera perspective to real-world field coordinates through homography, regardless of camera angle or movement. The transformed real-world coordinates can be used to calculate valuable tactical insights including player speed, distance covered, positioning heatmaps, and more complex team statistics, providing coaches and players with actionable performance data previously unavailable from standard video analysis.
- Abstract(参考訳): スポーツ分析は、コーチングの決定を通知し、選手のパフォーマンスを改善し、チームの戦略を強化する実行可能なデータを提供するので、チームパフォーマンスにとって非常に重要です。
ゲーム映像からより複雑な特徴を分析するために、コンピュータビジョンモデルを使用してフィールドからキーエンティティを識別し追跡することができる。
ゲーム中におけるプレーヤの位置を予測するためのオブジェクト検出とトラッキングシステムを提案する。
これをフィールド次元に関する位置推定に変換するために、フィールド上のキーポイントを特定し、これらを既知のフィールド次元と組み合わせて実際の距離を抽出する点予測モデルを用いる。
プレーヤー識別モデルでは, YOLOやFaster R-CNNなどのオブジェクト検出モデルを, 複数の評価指標を用いて, カスタム映像の精度に基づいて評価する。
目的は、セグメンテーションとトラッキングのためにSAM2 (Segment Anything Model 2) と組み合わせた場合、オブジェクト識別のための最良のモデルを特定し、最も正確な結果を得ることである。
キーポイント検出モデルでは,CNNモデルを用いてサッカー場内の一貫した位置を探索する。
ホモグラフィーにより、カメラパースペクティブにおけるポイントとオブジェクトの位置は、実地パースペクティブに変換される。
SAM2からのセグメンテッドプレイヤマスクは、カメラの視点から、カメラの角度や動きに関係なく、ホモグラフィを通して現実世界のフィールド座標に変換される。
トランスフォーメーションされた現実世界の座標は、プレイヤーの速度、距離のカバー、位置決めのヒートマップ、より複雑なチームの統計などの貴重な戦術的洞察を計算するために使用することができ、コーチや選手に、これまで標準のビデオ分析から利用できなかった実行可能なパフォーマンスデータを提供する。
関連論文リスト
- From Broadcast to Minimap: Achieving State-of-the-Art SoccerNet Game State Reconstruction [0.19748373512880277]
ゲーム・ステート・レコンストラクション(GSR)は、サッカーのフィールドプレーヤ、ゴールキーパー、審判員、その他全ての個人を正確に追跡し、ローカライズする。
この能力により、コーチやアナリストはプレイヤーの動き、チーム形成、ゲームダイナミクスに関する実用的な洞察を導き出すことができる。
単一カメラのセットアップを用いて,選手を一括して追跡する,堅牢なエンドツーエンドパイプラインを提案する。
論文 参考訳(メタデータ) (2025-04-08T18:10:44Z) - Game State and Spatio-temporal Action Detection in Soccer using Graph Neural Networks and 3D Convolutional Networks [1.4249472316161877]
サッカーは2つのデータソースに依存している。
本稿では,学習したエンドツーエンドと最先端の3D CNNによる視覚的・ゲーム的状態分析を組み合わせた時間的行動検出手法を提案する。
論文 参考訳(メタデータ) (2025-02-21T13:41:38Z) - TK-Planes: Tiered K-Planes with High Dimensional Feature Vectors for Dynamic UAV-based Scenes [58.180556221044235]
本研究では,無人航空機(UAV)の認識における合成データと実世界データとの領域ギャップを埋める新しい手法を提案する。
私たちの定式化は、小さな動く物体や人間の行動からなる動的なシーンのために設計されています。
我々は,Okutama ActionやUG2など,挑戦的なデータセットの性能を評価する。
論文 参考訳(メタデータ) (2024-05-04T21:55:33Z) - Helping Hands: An Object-Aware Ego-Centric Video Recognition Model [60.350851196619296]
オブジェクト認識デコーダを導入し、エゴ中心の動画におけるエゴ中心の表現の性能を向上させる。
このモデルは,エゴ認識ビデオモデルの代替として機能し,視覚テキストのグラウンド化による性能向上を図っている。
論文 参考訳(メタデータ) (2023-08-15T17:58:11Z) - SoccerNet-Tracking: Multiple Object Tracking Dataset and Benchmark in
Soccer Videos [62.686484228479095]
本稿では,各30の200列からなる複数物体追跡のための新しいデータセットを提案する。
データセットは、バウンディングボックスとトラックレットIDで完全に注釈付けされている。
分析の結果,サッカービデオにおける複数の選手,審判,ボール追跡が解決されるには程遠いことがわかった。
論文 参考訳(メタデータ) (2022-04-14T12:22:12Z) - HighlightMe: Detecting Highlights from Human-Centric Videos [52.84233165201391]
我々は,人間中心のビデオからハイライト可能な抜粋を検出するために,ドメインとユーザに依存しないアプローチを提案する。
本研究では,時空間グラフ畳み込みを用いたオートエンコーダネットワークを用いて,人間の活動やインタラクションを検出する。
我々は,最先端の手法に比べて,人手によるハイライトのマッチングの平均精度が4~12%向上したことを観察した。
論文 参考訳(メタデータ) (2021-10-05T01:18:15Z) - Monocular Quasi-Dense 3D Object Tracking [99.51683944057191]
周囲の物体の将来の位置を予測し、自律運転などの多くのアプリケーションで観測者の行動を計画するためには、信頼性と正確な3D追跡フレームワークが不可欠である。
移動プラットフォーム上で撮影された2次元画像のシーケンスから,移動物体を時間とともに効果的に関連付け,その全3次元バウンディングボックス情報を推定するフレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-12T15:30:02Z) - OmniDet: Surround View Cameras based Multi-task Visual Perception
Network for Autonomous Driving [10.3540046389057]
本研究は,未修正魚眼画像のマルチタスク視覚知覚ネットワークを提案する。
自動運転システムに必要な6つの主要なタスクで構成されている。
共同で訓練されたモデルは、それぞれのタスクバージョンよりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-02-15T10:46:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。