論文の概要: Precise Event Spotting in Sports Videos: Solving Long-Range Dependency and Class Imbalance
- arxiv url: http://arxiv.org/abs/2503.00147v1
- Date: Fri, 28 Feb 2025 19:53:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:19:23.878414
- Title: Precise Event Spotting in Sports Videos: Solving Long-Range Dependency and Class Imbalance
- Title(参考訳): スポーツビデオにおける精密イベントスポッティング:長距離依存性とクラス不均衡の解消
- Authors: Sanchayan Santra, Vishal Chudasama, Pankaj Wasnik, Vineeth N. Balasubramanian,
- Abstract要約: イベントスポッティング(英: Event Spotting、PES)は、特にスポーツにおいて、長くトリミングされていないビデオからイベントとそのクラスを特定することを目的としている。
既存の方法は、主に大きな事前訓練されたネットワークの機能に依存しており、タスクには適していないかもしれない。
本稿では, エンド・ツー・エンドの設計したネットワークが, 最先端のSOTA(State-of-the-art)手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 25.289420629683477
- License:
- Abstract: Precise Event Spotting (PES) aims to identify events and their class from long, untrimmed videos, particularly in sports. The main objective of PES is to detect the event at the exact moment it occurs. Existing methods mainly rely on features from a large pre-trained network, which may not be ideal for the task. Furthermore, these methods overlook the issue of imbalanced event class distribution present in the data, negatively impacting performance in challenging scenarios. This paper demonstrates that an appropriately designed network, trained end-to-end, can outperform state-of-the-art (SOTA) methods. Particularly, we propose a network with a convolutional spatial-temporal feature extractor enhanced with our proposed Adaptive Spatio-Temporal Refinement Module (ASTRM) and a long-range temporal module. The ASTRM enhances the features with spatio-temporal information. Meanwhile, the long-range temporal module helps extract global context from the data by modeling long-range dependencies. To address the class imbalance issue, we introduce the Soft Instance Contrastive (SoftIC) loss that promotes feature compactness and class separation. Extensive experiments show that the proposed method is efficient and outperforms the SOTA methods, specifically in more challenging settings.
- Abstract(参考訳): 精密イベントスポッティング (Precise Event Spotting, PES) は、特にスポーツにおいて、長くトリミングされていないビデオからイベントとそのクラスを特定することを目的としている。
PESの主な目的は、発生した瞬間にイベントを検出することである。
既存の方法は、主に大きな事前訓練されたネットワークの機能に依存しており、タスクには適していないかもしれない。
さらに、これらの手法は、データに存在する不均衡なイベントクラス分布の問題を見落とし、挑戦的なシナリオのパフォーマンスに悪影響を及ぼす。
本稿では, エンド・ツー・エンドの設計したネットワークが, 最先端のSOTA(State-of-the-art)手法より優れていることを示す。
特に,アダプティブ・スパティカル・テンポラル・リファインメント・モジュール(ASTRM)と長距離時空間モジュールにより拡張された畳み込み時空間特徴抽出器を備えたネットワークを提案する。
ASTRMは時空間情報によって特徴を強化する。
一方、長距離時間モジュールは、長距離依存関係をモデル化することによって、データからグローバルコンテキストを抽出するのに役立つ。
クラス不均衡問題に対処するために,機能コンパクト性とクラス分離を促進するソフトインスタンスコントラスト(Soft Instance Contrastive,SoftIC)損失を導入する。
大規模な実験により,提案手法は効率が高く,SOTA法よりも優れており,特に難易度の高い環境では優れていた。
関連論文リスト
- USDRL: Unified Skeleton-Based Dense Representation Learning with Multi-Grained Feature Decorrelation [24.90512145836643]
本稿では,特徴デコレーションに基づく統一骨格に基づくDense Representation Learningフレームワークを提案する。
我々のアプローチは現在のSOTA(State-of-the-art)アプローチよりも大幅に優れています。
論文 参考訳(メタデータ) (2024-12-12T12:20:27Z) - Long-Tailed Object Detection Pre-training: Dynamic Rebalancing Contrastive Learning with Dual Reconstruction [28.359463356384463]
2DRCL(Dynamic Rebalance Contrastive Learning with Dual Reconstruction)と呼ばれる,オブジェクト検出のための新たな事前学習フレームワークを導入する。
提案手法は,グローバルな文脈意味論と詳細な局所パターンの両方を捉えることによって,事前学習とオブジェクト検出を一致させる,ホロスティック・ローカル・コントラスト学習機構に基づいている。
COCOおよびLVIS v1.0データセットの実験により,本手法の有効性,特に末尾クラスにおけるmAP/APスコアの改善が示された。
論文 参考訳(メタデータ) (2024-11-14T13:59:01Z) - A federated large language model for long-term time series forecasting [4.696083734269233]
長距離時系列予測に適した連合型大言語モデル(LLM)であるFedTimeを提案する。
エッジデバイスやクライアントを別のクラスタに分割するために、K平均クラスタリングを採用しています。
また、チャンネルの独立性やパッチの適用により、ローカルなセマンティック情報をよりよく保存する。
論文 参考訳(メタデータ) (2024-07-30T02:38:27Z) - SFANet: Spatial-Frequency Attention Network for Weather Forecasting [54.470205739015434]
天気予報は様々な分野において重要な役割を担い、意思決定とリスク管理を推進している。
伝統的な手法は、しばしば気象系の複雑な力学を捉えるのに苦労する。
本稿では,これらの課題に対処し,天気予報の精度を高めるための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2024-05-29T08:00:15Z) - EAS-SNN: End-to-End Adaptive Sampling and Representation for Event-based Detection with Recurrent Spiking Neural Networks [14.046487518350792]
スパイキングニューラルネットワーク(SNN)は、スパーススパイク通信を通じてイベント駆動の操作を行う。
本稿では,Residual potential Dropout (RPD) と Spike-Aware Training (SAT) を導入する。
我々の方法では、Gen1データセットで4.4%のmAP改善が得られ、パラメータは38%減少し、3つのタイムステップしか必要としない。
論文 参考訳(メタデータ) (2024-03-19T09:34:11Z) - Embedded feature selection in LSTM networks with multi-objective
evolutionary ensemble learning for time series forecasting [49.1574468325115]
本稿では,Long Short-Term Memory Networkに埋め込まれた特徴選択手法を提案する。
本手法はLSTMの重みと偏りを分割的に最適化する。
イタリアとスペイン南東部の大気質時系列データの実験的評価により,従来のLSTMの能力一般化が著しく向上することが確認された。
論文 参考訳(メタデータ) (2023-12-29T08:42:10Z) - Cross-modal Prompts: Adapting Large Pre-trained Models for Audio-Visual
Downstream Tasks [55.36987468073152]
本稿では,DG-SCT(Dual-Guided Space-Channel-Temporal)アテンション機構を提案する。
DG-SCTモジュールはトレーニング可能なクロスモーダル・インタラクション・レイヤを事前トレーニングされたオーディオ・ビジュアル・エンコーダに組み込む。
提案手法は, AVE, AVVP, AVS, AVQA, AVQAを含む複数のダウンストリームタスクにまたがる最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2023-11-09T05:24:20Z) - Test-Time Compensated Representation Learning for Extreme Traffic
Forecasting [13.859278899032846]
混雑とラッシュアワーは、隣接する時間帯に様々な交差点で車両の速度の相関が低くなる可能性がある。
既存の手法では、テストフェーズ中に、最近および完全に分解されたトレーニングデータに基づいて、将来のシリーズを予測するのが一般的である。
マルチヘッド空間トランスモデルを用いたテスト時間表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-16T18:46:34Z) - Time-sensitive Learning for Heterogeneous Federated Edge Intelligence [52.83633954857744]
フェデレーションエッジインテリジェンス(FEI)システムにおけるリアルタイム機械学習について検討する。
FEIシステムは異種通信と計算資源分布を示す。
本稿では,共有MLモデルの協調学習における全体の実行時間を最小化するために,時間依存型フェデレーションラーニング(TS-FL)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-26T08:13:22Z) - FASA: Feature Augmentation and Sampling Adaptation for Long-Tailed
Instance Segmentation [91.129039760095]
ロングテールインスタンスセグメンテーションの最近の手法は、トレーニングデータが少ないレアオブジェクトクラスで未だに苦労している。
本稿では,FASA(Feature Augmentation and Smpling Adaptation)を提案する。
FASAは、標準またはロングテールのセグメンテーションフレームワークに簡単に接続できる、高速で汎用的な方法です。
論文 参考訳(メタデータ) (2021-02-25T14:07:23Z) - FMA-ETA: Estimating Travel Time Entirely Based on FFN With Attention [88.33372574562824]
フィードフォワードネットワーク(FFN, FFN, 複数要素自己認識(FMA-ETA)に基づく新しいフレームワークを提案する。
異なるカテゴリの特徴に対処し,情報を意図的に集約する,新しい多要素自己認識機構を提案する。
実験の結果、FMA-ETAは予測精度において最先端の手法と競合し、推論速度は大幅に向上した。
論文 参考訳(メタデータ) (2020-06-07T08:10:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。