論文の概要: ViTs for Action Classification in Videos: An Approach to Risky Tackle Detection in American Football Practice Videos
- arxiv url: http://arxiv.org/abs/2604.01318v1
- Date: Wed, 01 Apr 2026 18:43:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:09.769509
- Title: ViTs for Action Classification in Videos: An Approach to Risky Tackle Detection in American Football Practice Videos
- Title(参考訳): ビデオにおける行動分類のためのVTT:アメリカンフットボール練習ビデオにおけるリスクタックル検出へのアプローチ
- Authors: Syed Ahsan Masud Zaidi, William Hsu, Scott Dietrich,
- Abstract要約: 本稿では,アメリカンフットボールの練習ビデオにおける危険なタックルを検出する方法を提案する。
我々の研究には、733個のシングルアスリート・ダミータックル・クリップが含まれており、それぞれが1点接触の周囲に時間的に局在している。
不均衡学習を用いたビジョントランスフォーマーモデルを用いて,0.67のリスクリコールと0.59のリスクF1のリスクリコールを得る。
- 参考スコア(独自算出の注目度): 0.5046831208137846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early identification of hazardous actions in contact sports enables timely intervention and improves player safety. We present a method for detecting risky tackles in American football practice videos and introduce a substantially expanded dataset for this task. Our work contains 733 single-athlete-dummy tackle clips, each temporally localized around first point contact and labeled with a strike zone component of the standardized Assessment for Tackling Technique (SATT-3), extending prior work that reported 178 annotated videos. Using a Vision transformer-based model with imbalance-aware training, we obtain risky recall of 0.67 and Risky F1 of 0.59 under crossvalidation. Relative to the previous baseline in a smaller subset (risky recall of 0.58; Risky F1 0.56 ), our approach improves risky recall by more than 8% points on a much larger dataset. These results indicate that the vision transformer-based video analysis, coupled with careful handling of class imbalance, can reliably detect rare but safety-critical tackling patterns, offering a practical pathway toward coach-centered injury prevention tools.
- Abstract(参考訳): コンタクトスポーツにおける危険行動の早期発見は、タイムリーな介入を可能にし、選手の安全を向上させる。
本稿では,アメリカンフットボールの練習ビデオにおけるリスクタックルを検出する手法を提案する。
本研究は、733本のシングルアスリート・ダミータックルクリップを含み、それぞれ1点接触周辺に時間的に局在し、標準タックリング技術(SATT-3)のストライクゾーン成分をラベル付けし、178本の注釈付き動画を報告した先行作業を拡張した。
不均衡学習を用いたビジョントランスフォーマーモデルを用いて、クロスバリデーションにより0.67のリスクリコールと0.59のリスクF1のリスクリコールを得る。
より小さなサブセットの以前のベースライン(リコールは0.58、リスクF1 0.56)と比較して、我々のアプローチはより大きなデータセットで8%以上のリスクリコールを改善する。
これらの結果から,視覚変換器を用いた映像解析とクラス不均衡の慎重な取扱いが相まって,レアだが安全クリティカルなタックリングパターンを確実に検出できることが示唆された。
関連論文リスト
- When World Models Dream Wrong: Physical-Conditioned Adversarial Attacks against World Models [54.08784776767683]
本稿では,物理条件を乱す最初のホワイトボックス世界モデルアタックであるPhysCond-WMA(PhysCond-WMA)を提案する。
PhysCond-WMAは知覚の忠実さを維持しながら意味、論理、決定レベルの歪みを引き起こす。
論文 参考訳(メタデータ) (2026-02-21T07:22:37Z) - The Missing Half: Unveiling Training-time Implicit Safety Risks Beyond Deployment [148.80266237240713]
暗黙のトレーニング時間安全リスクは、モデルの内部インセンティブとコンテキスト背景情報によって引き起こされる。
5つのリスクレベル、10つのきめ細かいリスクカテゴリ、3つのインセンティブを持つ分類を導入した。
我々の結果は、過度に見過ごされているが、訓練における緊急の安全上の課題を特定します。
論文 参考訳(メタデータ) (2026-02-04T04:23:58Z) - Risk-Aware Human-in-the-Loop Framework with Adaptive Intrusion Response for Autonomous Vehicles [9.818695109452861]
自律走行車のためのリスク認識型ヒューマン・イン・ザ・ループ・フレームワークであるRAILを提案する。
RAILは、重み付きノイズORを介して3つのキューを侵入リスクスコア(IRS)に融合させる。
MetaDriveでは、テストリターン(TR)が360.65、テスト成功率(TSR)が0.85、テスト安全違反(TSV)が0.75、外乱率(DR)が0.0027である。
論文 参考訳(メタデータ) (2026-01-16T21:08:01Z) - Team-Aware Football Player Tracking with SAM: An Appearance-Based Approach to Occlusion Recovery [1.2461503242570642]
本稿では,サッカー選手を対象とした軽量なSAMベースのトラッキング手法を提案する。
この手法はCSRTトラッカーとジャージの色に基づく外観モデルを組み合わせたものである。
フットボールのビデオシーケンスの実験では、この手法が安定したメモリ使用量で7.6-7.7 FPSを達成することが示されている。
論文 参考訳(メタデータ) (2025-12-09T10:40:17Z) - Video-SafetyBench: A Benchmark for Safety Evaluation of Video LVLMs [45.265397990158846]
Video-SafetyBenchは、ビデオテキスト攻撃下でのLVLMの安全性を評価するために設計された最初のベンチマークである。
ビデオテキストのペアは2,264で、48のきめ細かいアンセーフなカテゴリにまたがっている。
安全性評価のためのセマンティックなビデオを生成するために,ビデオ意味論を主題画像とモーションテキストに分解する制御可能なパイプラインを設計する。
論文 参考訳(メタデータ) (2025-05-17T05:06:38Z) - Safety Pretraining: Toward the Next Generation of Safe AI [68.99129474671282]
モデルの安全性を最初から構築する,データ中心の事前トレーニングフレームワークを提案する。
我々のフレームワークは、セーフティフィルタリング、セーフティリフレージング、Native Refusal、Harmfulness-Tag Annotated Pretrainingの4つの重要なステップで構成されています。
我々の安全事前訓練モデルでは、一般的な劣化タスクのパフォーマンスを伴わない標準LLM安全性ベンチマークにおいて、攻撃成功率を38.8%から8.4%に下げている。
論文 参考訳(メタデータ) (2025-04-23T17:58:08Z) - FACTS: Fine-Grained Action Classification for Tactical Sports [4.810476621219244]
フェンシングやボクシングのような速いペースで密着したスポーツにおけるきめ細かいアクションの分類は、固有の課題である。
我々は、生のビデオデータを直接処理する、きめ細かいアクション認識のための新しいアプローチであるFACTSを紹介する。
本研究は, トレーニング, パフォーマンス分析, スペクタエンゲージメントを向上し, 戦術スポーツにおける行動分類のための新しいベンチマークを設定した。
論文 参考訳(メタデータ) (2024-12-21T03:00:25Z) - Towards Active Learning for Action Spotting in Association Football
Videos [59.84375958757395]
フットボールビデオの分析は困難であり、微妙で多様な時間的パターンを特定する必要がある。
現在のアルゴリズムは、限られた注釈付きデータから学ぶ際に大きな課題に直面している。
次にアノテートすべき最も情報に富んだビデオサンプルを選択する能動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-09T11:50:41Z) - Attacking Video Recognition Models with Bullet-Screen Comments [79.53159486470858]
本稿では,BSC攻撃による映像認識モデルに対する新たな敵攻撃を提案する。
BSCは一種の意味のあるパッチと見なすことができ、クリーンなビデオに追加しても、ビデオの内容に対する人々の理解に影響を与えたり、人々の疑念を喚起したりしない。
論文 参考訳(メタデータ) (2021-10-29T08:55:50Z) - Automated Tackle Injury Risk Assessment in Contact-Based Sports -- A
Rugby Union Example [1.160208922584163]
タックル・コリジョンに基づくスポーツにおけるビデオ分析は主観的で偏見にさらされる。
タックル・コリジョンに基づくスポーツにおけるマッチング分析の制限は、コンピュータビジョン応用の機会と見なすことができる。
ラグビーユニオンの試合におけるゲーム内タックルリスクを客観的に評価するシステムを提案する。
論文 参考訳(メタデータ) (2021-04-22T07:51:33Z) - Unsupervised Temporal Feature Aggregation for Event Detection in
Unstructured Sports Videos [10.230408415438966]
任意のカメラアングルを持つ非構造化環境を対象としたスポーツビデオにおけるイベント検出事例について検討した。
我々は、非構造化設定におけるプレイヤーの教師なし識別と、任意の射撃角度によるバリエーションを示すために訓練されたモデルの一般化の2つの主要な問題を同定し、解決する。
論文 参考訳(メタデータ) (2020-02-19T10:24:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。