論文の概要: FERA: Foil Fencing Referee Assistant Using Pose-Based Multi-Label Move Recognition and Rule Reasoning
- arxiv url: http://arxiv.org/abs/2509.18527v1
- Date: Tue, 23 Sep 2025 01:47:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.638262
- Title: FERA: Foil Fencing Referee Assistant Using Pose-Based Multi-Label Move Recognition and Rule Reasoning
- Title(参考訳): FERA: Pose-based Multi-Label Move Recognition と Rule Reasoning を用いたFair Fencing Referee Assistant
- Authors: Ziwen Chen, Zhong Wang,
- Abstract要約: 本稿では,フォイルフェンシングのAIレフェリーであるFERAを紹介する。
FerAはビデオから2D関節の位置を抽出し、それらを正規化し、101次元のキネマティック特徴集合を計算し、マルチラベル移動とブレード分類にトランスフォーマーを適用する。
優先度とスコアを決定するために、FERAは、エンコードされた権利規則を持つ蒸留言語モデルを適用している。
手書きデータに制限があるため、5倍のクロスバリデーションは平均マクロF1スコア0.549を達成し、時間畳み込みネットワーク(TCN)、BiLSTM、バニラ変換器など、複数のベースラインを上回っている。
- 参考スコア(独自算出の注目度): 2.3701787928978253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The sport of fencing, like many other sports, faces challenges in refereeing: subjective calls, human errors, bias, and limited availability in practice environments. We present FERA (Fencing Referee Assistant), a prototype AI referee for foil fencing which integrates pose-based multi-label action recognition and rule-based reasoning. FERA extracts 2D joint positions from video, normalizes them, computes a 101-dimensional kinematic feature set, and applies a Transformer for multi-label move and blade classification. To determine priority and scoring, FERA applies a distilled language model with encoded right-of-way rules, producing both a decision and an explanation for each exchange. With limited hand-labeled data, a 5-fold cross-validation achieves an average macro-F1 score of 0.549, outperforming multiple baselines, including a Temporal Convolutional Network (TCN), BiLSTM, and a vanilla Transformer. While not ready for deployment, these results demonstrate a promising path towards automated referee assistance in foil fencing and new opportunities for AI applications, such as coaching in the field of fencing.
- Abstract(参考訳): フェンシングのスポーツは、他の多くのスポーツと同様に、主観的呼び出し、ヒューマンエラー、バイアス、練習環境における限られた可用性といった、審判の課題に直面している。
本稿では、ポーズベースの多ラベルアクション認識とルールベースの推論を統合したフォイルフェンシングのAIレフェリーであるFERA(Fencing Referee Assistant)を提案する。
FERAはビデオから2D関節位置を抽出し、それらを正規化し、101次元のキネマティック特徴集合を計算し、マルチラベル移動とブレード分類にトランスフォーマーを適用する。
優先度と得点を決定するため、FERAは蒸留言語モデルに符号化された権利規則を適用し、各交換に対する決定と説明の両方を生成する。
手書きデータに制限があるため、5倍のクロスバリデーションは平均マクロF1スコア0.549を達成し、時間畳み込みネットワーク(TCN)、BiLSTM、バニラ変換器など、複数のベースラインを上回っている。
デプロイの準備は整っていないが、これらの結果は、フォイルフェンシングにおける自動審判支援への有望な道と、フェンシングの分野におけるコーチングのようなAIアプリケーションのための新たな機会を示している。
関連論文リスト
- Temporal Alignment-Free Video Matching for Few-shot Action Recognition [20.79048009076496]
提案手法は, 動作表現における時間単位の必要性を排除し, マッチング中にブルートフォースアライメントを不要とした, TEmporal Alignment-free Matching手法を提案する。
具体的には、TEAMは、アクションの長さや速度に関わらず、ビデオインスタンス内のグローバルな識別ヒントをキャプチャする、固定されたパターントークンセットで、各ビデオを表現する。
本稿では,クラス間の共通情報を識別・削除する適応プロセスを提案し,新しいカテゴリ間においても明確な境界を確立する。
論文 参考訳(メタデータ) (2025-04-08T12:11:11Z) - LEAF: Unveiling Two Sides of the Same Coin in Semi-supervised Facial Expression Recognition [56.22672276092373]
半教師付き学習は、表情認識におけるラベル不足の課題に取り組むための有望なアプローチとして現れてきた。
半教師付きFERのための表現関連表現と擬似ラベルを協調する統合フレームワークであるhierarchicaL dEcoupling And Fusing (LEAF)を提案する。
論文 参考訳(メタデータ) (2024-04-23T13:43:33Z) - Multiscale Vision Transformers meet Bipartite Matching for efficient single-stage Action Localization [27.472705540825316]
アクションローカライゼーションは、しばしば別々に対処される検出タスクと認識タスクを組み合わせた、困難な問題である。
両タスクを両パートマッチングでトレーニングした単一のMViTv2-Sアーキテクチャが,RoIで事前計算した有界ボックス上でトレーニングした場合,同一のMViTv2-Sを超えることを示す。
論文 参考訳(メタデータ) (2023-12-29T17:08:38Z) - Actor-agnostic Multi-label Action Recognition with Multi-modal Query [42.38571663534819]
既存の行動認識法は通常アクター固有のものである。
これはアクター固有のポーズ推定(例えば人間対動物)を必要とする。
我々は「アクター非依存型マルチモーダルマルチラベル動作認識」という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-07-20T10:53:12Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Rethinking the Two-Stage Framework for Grounded Situation Recognition [61.93345308377144]
接地状況認識は「人間のような」事象理解に向けた重要なステップである。
既存のGSR手法では、第1段階で動詞を予測し、第2段階での意味的役割を検出するという、2段階の枠組みを採用している。
本稿では,CFVM (Coarse-to-Fine Verb Model) と Transformer-based Noun Model (TNM) で構成される新しいGSR用SituFormerを提案する。
論文 参考訳(メタデータ) (2021-12-10T08:10:56Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。