論文の概要: ASTRA: An Action Spotting TRAnsformer for Soccer Videos
- arxiv url: http://arxiv.org/abs/2404.01891v1
- Date: Tue, 2 Apr 2024 12:29:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-03 16:28:46.626700
- Title: ASTRA: An Action Spotting TRAnsformer for Soccer Videos
- Title(参考訳): ASTRA:サッカービデオのためのアクションスポッティングトラスフォーマー
- Authors: Artur Xarles, Sergio Escalera, Thomas B. Moeslund, Albert Clapés,
- Abstract要約: ASTRAは、サッカーの試合におけるアクションスポッティングのタスク用に設計されたトランスフォーマーベースのモデルである。
ASTRAはタスクとデータセットに固有のいくつかの課題に対処する。
その結果、ASTRAの有効性が示され、テストセット上で平均平均mAP66.82が達成された。
- 参考スコア(独自算出の注目度): 45.560172973071474
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In this paper, we introduce ASTRA, a Transformer-based model designed for the task of Action Spotting in soccer matches. ASTRA addresses several challenges inherent in the task and dataset, including the requirement for precise action localization, the presence of a long-tail data distribution, non-visibility in certain actions, and inherent label noise. To do so, ASTRA incorporates (a) a Transformer encoder-decoder architecture to achieve the desired output temporal resolution and to produce precise predictions, (b) a balanced mixup strategy to handle the long-tail distribution of the data, (c) an uncertainty-aware displacement head to capture the label variability, and (d) input audio signal to enhance detection of non-visible actions. Results demonstrate the effectiveness of ASTRA, achieving a tight Average-mAP of 66.82 on the test set. Moreover, in the SoccerNet 2023 Action Spotting challenge, we secure the 3rd position with an Average-mAP of 70.21 on the challenge set.
- Abstract(参考訳): 本稿では,サッカーにおけるアクションスポッティングのためのトランスフォーマーモデルであるASTRAを紹介する。
ASTRAはタスクとデータセットに固有のいくつかの課題に対処し、正確なアクションローカライゼーションの要件、長いテールデータ分布の存在、特定のアクションの非可視性、固有のラベルノイズを含む。
そのため ASTRA は
(a)トランスフォーマーエンコーダデコーダアーキテクチャにより、所望の出力時間分解を達成し、正確な予測を行う。
(b)データの長期分布を扱うためのバランスの取れた混合戦略
(c)ラベルの変動を捉える不確実性を考慮した変位ヘッド、及び
(d)非可視動作の検出を強化するための入力音声信号。
その結果、ASTRAの有効性が示され、テストセット上で平均平均mAP66.82が達成された。
さらに、サッカーネット2023アクションスポッティングチャレンジでは、平均mAP70.21で3位を確保します。
関連論文リスト
- SELD-Mamba: Selective State-Space Model for Sound Event Localization and Detection with Source Distance Estimation [21.82296230219289]
選択状態空間モデルであるMambaを利用するSELD-Mambaと呼ばれるSELDのネットワークアーキテクチャを提案する。
本研究では,イベント独立ネットワークV2(EINV2)を基本フレームワークとして採用し,コンバータブロックを双方向のMambaブロックに置き換える。
本研究では,2段階の訓練手法を実装し,第1段階は音事象検出(SED)とDoAの方向推定損失に着目し,第2段階は音源距離推定(SDE)の損失を再導入する。
論文 参考訳(メタデータ) (2024-08-09T13:26:08Z) - Magnitude and Rotation Invariant Detection of Transportation Modes with Missing Data Modalities [0.5762345156477738]
この研究は、2024年のSHL認識チャレンジに対するSignal Sleuthsチームの解決策を示す。
この課題は、電話移動データのシャッフルされた非重なり合う5秒のウィンドウを使用して、移動モードを検出することである。
データ分析は、列車と検証データの間に大きな分布シフトを示し、大きさと回転不変のアプローチを必要とした。
論文 参考訳(メタデータ) (2024-07-08T13:42:01Z) - DeTra: A Unified Model for Object Detection and Trajectory Forecasting [68.85128937305697]
提案手法は,2つのタスクの結合を軌道修正問題として定式化する。
この統合タスクに対処するために、オブジェクトの存在, ポーズ, マルチモーダルな将来の振る舞いを推測する精細化変換器を設計する。
実験では、我々のモデルはArgoverse 2 Sensor and Openデータセットの最先端性よりも優れています。
論文 参考訳(メタデータ) (2024-06-06T18:12:04Z) - Modality Prompts for Arbitrary Modality Salient Object Detection [57.610000247519196]
本論文は、任意のモーダリティ・サリエント物体検出(AM SOD)の課題について述べる。
任意のモダリティ、例えばRGBイメージ、RGB-Dイメージ、RGB-D-Tイメージから有能なオブジェクトを検出することを目的としている。
AM SODの2つの基本的な課題を解明するために,新しいモード適応トランス (MAT) を提案する。
論文 参考訳(メタデータ) (2024-05-06T11:02:02Z) - Mitigating Distributional Shift in Semantic Segmentation via Uncertainty
Estimation from Unlabelled Data [19.000718685399935]
本研究では,1回のフォワードパスで追加のアノテーションを使わずに,テストドメインの挑戦によるエラーを検出するセグメンテーションネットワークを提案する。
我々は、データ拡張に対する一貫性を強制することによって、不確実性推定を選択的に行うことを学ぶために、簡単で不正確で不確実なデータを使用する。
提案手法はGamma-SSLと名付けられ,不確実性推定とOoD(Out-of-Distribution)技術より一貫して優れている。
論文 参考訳(メタデータ) (2024-02-27T16:23:11Z) - Beyond Sharing Weights in Decoupling Feature Learning Network for UAV
RGB-Infrared Vehicle Re-Identification [7.907187589000295]
無人航空機(UAV)をベースとしたクロスモダリティ車両のRe-IDは、ビデオ監視と公共セキュリティにおいて注目を集めている。
我々はUAVクロスモダリティ・ビークル・Re-ID(UCM-VeID)という,16015RGBと13913赤外画像の753のIDを含むクロスモダリティ車両Re-IDベンチマークを考案した。
そこで本研究では,ハイブリッドウェイトデカップリングネットワーク(HWDNet)を提案する。
論文 参考訳(メタデータ) (2023-10-12T04:12:43Z) - Fusing Pseudo Labels with Weak Supervision for Dynamic Traffic Scenarios [0.0]
我々は、異種データセットで訓練されたオブジェクト検出モデルから擬似ラベルをアマルガメートする弱い教師付きラベル統一パイプラインを導入する。
我々のパイプラインは、異なるデータセットからのラベルの集約、バイアスの修正、一般化の強化を通じて、統一されたラベル空間をエンゲージする。
我々は,統合ラベル空間を用いた単独物体検出モデルを再学習し,動的交通シナリオに精通した弾力性のあるモデルを構築した。
論文 参考訳(メタデータ) (2023-08-30T11:33:07Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Adversarial Imitation Learning with Trajectorial Augmentation and
Correction [61.924411952657756]
本稿では,拡張軌道の成功を保った新しい拡張手法を提案する。
我々は, 合成専門家を用いた模倣エージェントの訓練を行うために, 逆データ拡張模倣アーキテクチャを開発した。
実験により,我々のデータ拡張戦略は,敵対的模倣の精度と収束時間を向上できることが示された。
論文 参考訳(メタデータ) (2021-03-25T14:49:32Z) - AutoAssign: Differentiable Label Assignment for Dense Object Detection [94.24431503373884]
Auto COCOは、物体検出のためのアンカーフリー検出器である。
外観認識は、完全に微分可能な重み付け機構によって実現される。
我々の最良のモデルでは52.1%のAPが達成され、既存の1段検出器よりも優れている。
論文 参考訳(メタデータ) (2020-07-07T14:32:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。