論文の概要: Learning Football Body-Orientation as a Matter of Classification
- arxiv url: http://arxiv.org/abs/2106.00359v1
- Date: Tue, 1 Jun 2021 10:12:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-02 21:33:58.549254
- Title: Learning Football Body-Orientation as a Matter of Classification
- Title(参考訳): フットボールのボディーオリエンテーションを分類として学ぶ
- Authors: Adri\`a Arbu\'es-Sang\"uesa, Adri\'an Mart\'in, Paulino Granero,
Coloma Ballester, Gloria Haro
- Abstract要約: 本稿では,ビデオ映像から直接向きを推定するための最初のディープラーニングモデルを提案する。
このモデルは、ウェアラブルEPTSデバイスから得られた地中構造データを用いて訓練される。
絶対的な中央値誤差はプレイヤー1人当たり12度未満である。
- 参考スコア(独自算出の注目度): 7.4022258821325115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Orientation is a crucial skill for football players that becomes a
differential factor in a large set of events, especially the ones involving
passes. However, existing orientation estimation methods, which are based on
computer-vision techniques, still have a lot of room for improvement. To the
best of our knowledge, this article presents the first deep learning model for
estimating orientation directly from video footage. By approaching this
challenge as a classification problem where classes correspond to orientation
bins, and by introducing a cyclic loss function, a well-known convolutional
network is refined to provide player orientation data. The model is trained by
using ground-truth orientation data obtained from wearable EPTS devices, which
are individually compensated with respect to the perceived orientation in the
current frame. The obtained results outperform previous methods; in particular,
the absolute median error is less than 12 degrees per player. An ablation study
is included in order to show the potential generalization to any kind of
football video footage.
- Abstract(参考訳): オリエンテーションはサッカー選手にとって重要なスキルであり、多くのイベント、特にパスを含むイベントにおいて差別化要因となる。
しかし、既存の方向推定手法は、コンピュータビジョン技術に基づいているが、改善の余地は多い。
我々の知る限り、本論文はビデオ映像から直接向きを推定する最初のディープラーニングモデルを示す。
クラスが配向ビンに対応する分類問題としてこの課題にアプローチし、循環損失関数を導入することにより、有名な畳み込みネットワークを改良し、プレーヤの配向データを提供する。
このモデルは、現在のフレームの認識方向に対して個別に補償されるウェアラブルEPTSデバイスから得られる地中構造データを用いて訓練される。
得られた結果は従来の手法よりも優れており、特に絶対中央値誤差はプレイヤー当たり12度以下である。
あらゆる種類のフットボールビデオ映像に潜在的な一般化を示すために、アブレーション研究が行われる。
関連論文リスト
- Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - A Study of Forward-Forward Algorithm for Self-Supervised Learning [65.268245109828]
本研究では,自己指導型表現学習におけるフォワードとバックプロパゲーションのパフォーマンスについて検討する。
我々の主な発見は、フォワードフォワードアルゴリズムが(自己教師付き)トレーニング中にバックプロパゲーションに相容れないように機能するのに対し、転送性能は研究されたすべての設定において著しく遅れていることである。
論文 参考訳(メタデータ) (2023-09-21T10:14:53Z) - Constructing Balance from Imbalance for Long-tailed Image Recognition [50.6210415377178]
多数派(頭)クラスと少数派(尾)クラスの不均衡は、データ駆動のディープニューラルネットワークを著しく歪ませる。
従来の手法では、データ分散、特徴空間、モデル設計の観点からデータ不均衡に対処していた。
ラベル空間を段階的に調整し,ヘッドクラスとテールクラスを分割することで,簡潔なパラダイムを提案する。
提案モデルでは,特徴評価手法も提供し,長期的特徴学習の道を開く。
論文 参考訳(メタデータ) (2022-08-04T10:22:24Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - DILEMMA: Self-Supervised Shape and Texture Learning with Transformers [33.296154476701055]
自己教師型学習により学習したモデルにおいて,形状とテクスチャの識別性を明示的に向上する擬似タスクを提案する。
我々は提案手法をDILEMMAと呼び,MAsked入力による不正確な位置EMベディングの検出を行う。
論文 参考訳(メタデータ) (2022-04-10T22:58:02Z) - Relieving Long-tailed Instance Segmentation via Pairwise Class Balance [85.53585498649252]
長い尾のインスタンスセグメンテーションは、クラス間のトレーニングサンプルの極端な不均衡のために難しいタスクである。
尾のついたものに対して、(大多数のサンプルを含む)ヘッドクラスの深刻なバイアスを引き起こす。
そこで本研究では,学習中の予測嗜好を蓄積するために,学習中に更新される混乱行列上に構築された新しいPairwise Class Balance(PCB)手法を提案する。
論文 参考訳(メタデータ) (2022-01-08T07:48:36Z) - Reducing Representation Drift in Online Continual Learning [87.71558506591937]
私たちは、エージェントが制限されたメモリと計算で変化する分布から学ぶ必要があるオンライン連続学習パラダイムを研究します。
この作業では、入ってくるデータストリームに未観測のクラスサンプルが導入されることにより、事前に観測されたデータの表現の変化に焦点を合わせます。
論文 参考訳(メタデータ) (2021-04-11T15:19:30Z) - Incremental Learning from Low-labelled Stream Data in Open-Set Video
Face Recognition [0.0]
本稿では,深層機能エンコーダとSVMのオープンセット動的アンサンブルを組み合わせた新しいインクリメンタル学習手法を提案する。
本手法は,教師なしの操作データを用いて認識性を向上させる。
結果は、非適応状態の方法に対する最大15%のF1スコア増加の利点を示しています。
論文 参考訳(メタデータ) (2020-12-17T13:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。