論文の概要: X-VARS: Introducing Explainability in Football Refereeing with Multi-Modal Large Language Model
- arxiv url: http://arxiv.org/abs/2404.06332v1
- Date: Sun, 7 Apr 2024 12:42:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 14:30:51.125206
- Title: X-VARS: Introducing Explainability in Football Refereeing with Multi-Modal Large Language Model
- Title(参考訳): X-VARS: マルチモーダル大言語モデルによるサッカー中継における説明可能性の導入
- Authors: Jan Held, Hani Itani, Anthony Cioppa, Silvio Giancola, Bernard Ghanem, Marc Van Droogenbroeck,
- Abstract要約: 本稿では,サッカー映像のレフェリーの観点からの理解を目的としたマルチモーダルな大規模言語モデルである Explainable Video Assistant Referee System, X- VARS を紹介する。
X-VARSは、ビデオ記述、質問応答、行動認識、意味のある会話の実行など、多数のタスクを実行することができる。
我々は,新しいデータセットである SoccerNet-XFoul のX-VARS を検証した。
- 参考スコア(独自算出の注目度): 56.393522913188704
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement of artificial intelligence has led to significant improvements in automated decision-making. However, the increased performance of models often comes at the cost of explainability and transparency of their decision-making processes. In this paper, we investigate the capabilities of large language models to explain decisions, using football refereeing as a testing ground, given its decision complexity and subjectivity. We introduce the Explainable Video Assistant Referee System, X-VARS, a multi-modal large language model designed for understanding football videos from the point of view of a referee. X-VARS can perform a multitude of tasks, including video description, question answering, action recognition, and conducting meaningful conversations based on video content and in accordance with the Laws of the Game for football referees. We validate X-VARS on our novel dataset, SoccerNet-XFoul, which consists of more than 22k video-question-answer triplets annotated by over 70 experienced football referees. Our experiments and human study illustrate the impressive capabilities of X-VARS in interpreting complex football clips. Furthermore, we highlight the potential of X-VARS to reach human performance and support football referees in the future.
- Abstract(参考訳): 人工知能の急速な進歩は、自動意思決定の大幅な改善につながった。
しかしながら、モデルの性能向上は多くの場合、意思決定プロセスの説明可能性と透明性の犠牲になる。
本稿では,サッカー審判を試験場として用い,意思決定の複雑さと主観性を考慮し,大規模言語モデルの意思決定能力について検討する。
本稿では,サッカー映像のレフェリーの観点からの理解を目的としたマルチモーダルな大規模言語モデルである Explainable Video Assistant Referee System (X-VARS) を紹介する。
X-VARSは、ビデオ記述、質問応答、行動認識、ビデオコンテンツに基づく有意義な会話、およびフットボール審判のためのゲーム法に従って、多岐にわたるタスクを実行することができる。
我々は,新しいデータセットである SoccerNet-XFoul にX-VARS を検証した。
我々は,複雑なサッカークリップの解釈におけるX-VARSの印象的な機能について,実験と人間による研究を行った。
また,今後,X-VARSが人間のパフォーマンスに到達し,サッカー審判を支援する可能性を強調した。
関連論文リスト
- Towards AI-Powered Video Assistant Referee System (VARS) for Association Football [58.04352163544319]
Video Assistant Referee (VAR)は、バックステージの審判が複数の視点からピッチ上のインシデントをレビューできるようにするイノベーションである。
VARは現在、高価なインフラと世界中の審判の欠如のために、プロリーグに限られている。
マルチビュービデオ解析における最新の知見を活用する半自動ビデオアシスタント参照システム(VARS)を提案する。
論文 参考訳(メタデータ) (2024-07-17T11:09:03Z) - Deep Understanding of Soccer Match Videos [20.783415560412003]
サッカーは世界中で最も人気のあるスポーツの1つであり、主要な試合で頻繁に放送される。
本システムでは, サッカーボール, 選手, 審判などの重要な物体を検知できる。
また、プレイヤーとボールの動きを追跡し、プレイヤーの番号を認識し、シーンを分類し、ゴールキックのようなハイライトを識別する。
論文 参考訳(メタデータ) (2024-07-11T05:54:13Z) - VARS: Video Assistant Referee System for Automated Soccer Decision
Making from Multiple Views [70.70161449930127]
Video Assistant Refereeは協会サッカーに革命をもたらし、審判がピッチ上のインシデントをレビューできるようにする。
しかし、多くの国での審判の欠如とVARインフラの高コストのため、プロリーグのみがその恩恵を受けることができる。
サッカーの意思決定を自動化するビデオアシスタント参照システム(VARS)を提案する。
論文 参考訳(メタデータ) (2023-04-10T14:33:05Z) - GOAL: A Challenging Knowledge-grounded Video Captioning Benchmark for
Real-time Soccer Commentary Generation [75.60413443783953]
我々は,KGVC(Knowledge-grounded Video Captioning)として新たなタスク設定を提案するための,8.9k以上のサッカービデオクリップ,22kの文,42kの知識トリプルのベンチマークであるGOALを提案する。
私たちのデータとコードはhttps://github.com/THU-KEG/goal.orgで公開されています。
論文 参考訳(メタデータ) (2023-03-26T08:43:36Z) - Evaluating Soccer Player: from Live Camera to Deep Reinforcement
Learning [0.0]
オープンソースのプレイヤー追跡モデルと、Deep Reinforcement Learningのみに基づいてこれらのプレイヤーを評価する新しいアプローチの2つの部分のソリューションを紹介します。
私達の追跡モデルは私達がまた解放するデータセットの監視された方法で訓練され、私達の評価モデルは仮想サッカーゲームのシミュレーションだけに頼ります。
新たなアプローチであるExpected Discounted Goal(EDG)は、チームが特定の状態から獲得または達成できる目標の数を表します。
論文 参考訳(メタデータ) (2021-01-13T23:26:17Z) - SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of
Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。
SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。
サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文 参考訳(メタデータ) (2020-11-26T16:10:16Z) - Game Plan: What AI can do for Football, and What Football can do for AI [83.79507996785838]
予測的および規範的フットボール分析は、統計学習、ゲーム理論、コンピュータビジョンの交差点における新たな発展と進歩を必要とする。
フットボール分析は、サッカー自体のゲームを変えるだけでなく、この領域がAIの分野で何を意味するのかという観点からも、非常に価値の高いゲームチェンジャーであることを示す。
論文 参考訳(メタデータ) (2020-11-18T10:26:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。