論文の概要: Puck Localization Using Contextual Cues
- arxiv url: http://arxiv.org/abs/2506.04365v1
- Date: Wed, 04 Jun 2025 18:25:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.376406
- Title: Puck Localization Using Contextual Cues
- Title(参考訳): コンテクストキューを用いたパックの局所化
- Authors: Liam Salass, Jerrin Bright, Amir Nazemi, Yuhao Chen, John Zelek, David Clausi,
- Abstract要約: アイスホッケーの放送ビデオにおけるパック検出は重大な課題となっている。
以前の作品では、プレイヤーの振る舞いから派生したキューを明示的にモデル化することなく、パックの外観や動きに基づくキューに焦点を当てていた。
Puck Localization Using Contextual Cues (PLUCC) を提案する。
- 参考スコア(独自算出の注目度): 3.946222668376764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Puck detection in ice hockey broadcast videos poses significant challenges due to the puck's small size, frequent occlusions, motion blur, broadcast artifacts, and scale inconsistencies due to varying camera zoom and broadcast camera viewpoints. Prior works focus on appearance-based or motion-based cues of the puck without explicitly modelling the cues derived from player behaviour. Players consistently turn their bodies and direct their gaze toward the puck. Motivated by this strong contextual cue, we propose Puck Localization Using Contextual Cues (PLUCC), a novel approach for scale-aware and context-driven single-frame puck detections. PLUCC consists of three components: (a) a contextual encoder, which utilizes player orientations and positioning as helpful priors; (b) a feature pyramid encoder, which extracts multiscale features from the dual encoders; and (c) a gating decoder that combines latent features with a channel gating mechanism. For evaluation, in addition to standard average precision, we propose Rink Space Localization Error (RSLE), a scale-invariant homography-based metric for removing perspective bias from rink space evaluation. The experimental results of PLUCC on the PuckDataset dataset demonstrated state-of-the-art detection performance, surpassing previous baseline methods by an average precision improvement of 12.2\% and RSLE average precision of 25\%. Our research demonstrates the critical role of contextual understanding in improving puck detection performance, with broad implications for automated sports analysis.
- Abstract(参考訳): アイスホッケーの放送ビデオにおけるパック検出は、パックの小さなサイズ、頻繁なオクルージョン、動きのぼかし、ブロードキャストのアーティファクト、および様々なカメラズームとブロードキャストカメラの視点によるスケールの不整合による重大な課題を提起する。
以前の作品では、プレイヤーの振る舞いから派生したキューを明示的にモデル化することなく、パックの外観や動きに基づくキューに焦点を当てていた。
プレイヤーは常に体を回し、パックに向かって視線を向ける。
コンテキストキューを用いたパック局所化(PLUCC: Puck Localization Using Contextual Cues)を提案する。
PLUCCは3つのコンポーネントから構成される。
(a) プレイヤーの配向及び位置を有用な先行として利用する文脈エンコーダ
b)デュアルエンコーダからマルチスケール特徴を抽出する特徴ピラミッドエンコーダ
(c)潜伏特徴とチャネルゲーティング機構を組み合わせたゲーティングデコーダ。
評価のために、標準平均精度に加えて、スケール不変なホモグラフィーに基づく尺度であるリンク空間局所化誤差(RSLE)を提案し、リンク空間評価から視点バイアスを取り除く。
PuckDatasetデータセットにおけるPLUCCの実験結果は、従来のベースライン法を12.2\%、RSLE平均精度25\%で上回り、最先端検出性能を示した。
本研究は,パック検出性能向上における文脈理解の重要性を実証し,自動スポーツ分析に広く影響している。
関連論文リスト
- SOTA: Spike-Navigated Optimal TrAnsport Saliency Region Detection in Composite-bias Videos [50.51658520045165]
Spike-d TrAnsport Saliency Region Detection (SOTA)は、スパイクカメラの強度を活用しつつ、空間次元と時間次元の両方のバイアスを緩和するフレームワークである。
本手法では,微妙なフレーム・ツー・フレームの変動を捉えるために,スパイクに基づくマイクロデビア(SM)を導入する。
SOTAは様々な条件にまたがる不整合を減らして予測を洗練させる。
論文 参考訳(メタデータ) (2025-05-01T08:30:40Z) - Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。
本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T12:39:56Z) - Multi Player Tracking in Ice Hockey with Homographic Projections [13.320838012645444]
アイスホッケーにおけるマルチオブジェクト追跡(MOT)は、選手の身元を維持するために、特定のシーケンスにまたがるプレイヤーのローカライズとアソシエイトという複合的なタスクを追求する。
ホモグラフィーを応用した二部グラフマッチング問題としてMOTを定式化した新しい追跡手法を提案する。
我々は,足のキーポイントをオーバヘッドリンクテンプレートにマッピングし,これらの投影された位置をグラフネットワークにエンコードすることで,放送ビューにおけるOccludedとOverlappingのプレイヤーの位置表現を解き放つ。
論文 参考訳(メタデータ) (2024-05-22T07:14:55Z) - Domain-Guided Masked Autoencoders for Unique Player Identification [62.87054782745536]
マスク付きオートエンコーダ (MAE) は, 従来の特徴抽出器よりも優れた代替手段として出現している。
人間の視覚に触発され、我々はd-MAEと呼ばれるMAEのための新しいドメイン誘導マスキングポリシーを考案した。
3つの大規模スポーツデータセットの実験を行った。
論文 参考訳(メタデータ) (2024-03-17T20:14:57Z) - Semantic keypoint extraction for scanned animals using
multi-depth-camera systems [2.513785998932353]
ポイントクラウドにおけるキーポイントアノテーションは、3D再構成、オブジェクト追跡、アライメントにおいて重要なタスクである。
農業の文脈では、家畜の自動化が条件評価や行動認識に向けて働くことが重要な課題である。
本稿では,キーポイント抽出を回帰問題として再構成することで,ポイントクラウドにおける意味キーポイントアノテーションの新たなアプローチを提案する。
本手法は,複数のハードウェア同期RGB-Dカメラの校正システムを用いて,移動牛のフィールドで収集したデータを用いて実験を行った。
論文 参考訳(メタデータ) (2022-11-16T03:06:17Z) - Pixel-Perfect Structure-from-Motion with Featuremetric Refinement [96.73365545609191]
複数視点からの低レベル画像情報を直接アライメントすることで、動きからの2つの重要なステップを洗練する。
これにより、様々なキーポイント検出器のカメラポーズとシーン形状の精度が大幅に向上する。
本システムは,大規模な画像コレクションに容易にスケールできるので,クラウドソースによる大規模なローカライゼーションを実現することができる。
論文 参考訳(メタデータ) (2021-08-18T17:58:55Z) - Puck localization and multi-task event recognition in broadcast hockey
videos [9.316018917078049]
パックのローカライゼーションは、アイスホッケービデオ分析においてゲーム分析に有用な重要な問題である。
ブロードキャストホッケービデオにおけるパックローカライズのためのネットワークを導入し実装する。
論文 参考訳(メタデータ) (2021-05-21T20:43:54Z) - Unsupervised Visual Representation Learning by Tracking Patches in Video [88.56860674483752]
本研究では,コンピュータビジョンシステムのプロキシタスクとしてトラッキングを用いて視覚表現を学習することを提案する。
子どもたちがプレイするキャッチゲームをベースに、視覚表現を学ぶ3D-CNNモデルのためのキャッチ・ザ・パッチ(CtP)ゲームを設計します。
論文 参考訳(メタデータ) (2021-05-06T09:46:42Z) - Localization of Ice-Rink for Broadcast Hockey Videos [75.9924857328797]
放送ビデオからのホッケーアイスリンクローカライズのためのフレームワークを紹介する。
ResNet18ベースの回帰器が実装され、訓練され、フレーム単位でモデル上の4つの制御ポイントに回帰する。
滑らかなホモグラフィ行列は、対応する4つの点の対の直線型変換を用いて計算される。
論文 参考訳(メタデータ) (2021-04-22T03:39:43Z) - Unsupervised Temporal Feature Aggregation for Event Detection in
Unstructured Sports Videos [10.230408415438966]
任意のカメラアングルを持つ非構造化環境を対象としたスポーツビデオにおけるイベント検出事例について検討した。
我々は、非構造化設定におけるプレイヤーの教師なし識別と、任意の射撃角度によるバリエーションを示すために訓練されたモデルの一般化の2つの主要な問題を同定し、解決する。
論文 参考訳(メタデータ) (2020-02-19T10:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。