Fugu-MT 論文翻訳(概要): X-VARS: Introducing Explainability in Football Refereeing with Multi-Modal Large Language Model

論文の概要: X-VARS: Introducing Explainability in Football Refereeing with Multi-Modal Large Language Model

arxiv url: http://arxiv.org/abs/2404.06332v1
Date: Sun, 7 Apr 2024 12:42:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-10 14:30:51.125206
Title: X-VARS: Introducing Explainability in Football Refereeing with Multi-Modal Large Language Model
Title（参考訳）: X-VARS: マルチモーダル大言語モデルによるサッカー中継における説明可能性の導入
Authors: Jan Held, Hani Itani, Anthony Cioppa, Silvio Giancola, Bernard Ghanem, Marc Van Droogenbroeck,
Abstract要約: 本稿では,サッカー映像のレフェリーの観点からの理解を目的としたマルチモーダルな大規模言語モデルである Explainable Video Assistant Referee System, X- VARS を紹介する。 X-VARSは、ビデオ記述、質問応答、行動認識、意味のある会話の実行など、多数のタスクを実行することができる。我々は,新しいデータセットである SoccerNet-XFoul のX-VARS を検証した。
参考スコア（独自算出の注目度）: 56.393522913188704
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The rapid advancement of artificial intelligence has led to significant improvements in automated decision-making. However, the increased performance of models often comes at the cost of explainability and transparency of their decision-making processes. In this paper, we investigate the capabilities of large language models to explain decisions, using football refereeing as a testing ground, given its decision complexity and subjectivity. We introduce the Explainable Video Assistant Referee System, X-VARS, a multi-modal large language model designed for understanding football videos from the point of view of a referee. X-VARS can perform a multitude of tasks, including video description, question answering, action recognition, and conducting meaningful conversations based on video content and in accordance with the Laws of the Game for football referees. We validate X-VARS on our novel dataset, SoccerNet-XFoul, which consists of more than 22k video-question-answer triplets annotated by over 70 experienced football referees. Our experiments and human study illustrate the impressive capabilities of X-VARS in interpreting complex football clips. Furthermore, we highlight the potential of X-VARS to reach human performance and support football referees in the future.
Abstract（参考訳）: 人工知能の急速な進歩は、自動意思決定の大幅な改善につながった。しかしながら、モデルの性能向上は多くの場合、意思決定プロセスの説明可能性と透明性の犠牲になる。本稿では,サッカー審判を試験場として用い,意思決定の複雑さと主観性を考慮し,大規模言語モデルの意思決定能力について検討する。本稿では,サッカー映像のレフェリーの観点からの理解を目的としたマルチモーダルな大規模言語モデルである Explainable Video Assistant Referee System (X-VARS) を紹介する。 X-VARSは、ビデオ記述、質問応答、行動認識、ビデオコンテンツに基づく有意義な会話、およびフットボール審判のためのゲーム法に従って、多岐にわたるタスクを実行することができる。我々は,新しいデータセットである SoccerNet-XFoul にX-VARS を検証した。我々は,複雑なサッカークリップの解釈におけるX-VARSの印象的な機能について,実験と人間による研究を行った。また,今後,X-VARSが人間のパフォーマンスに到達し,サッカー審判を支援する可能性を強調した。

関連論文リスト

Interpretable Low-Dimensional Modeling of Spatiotemporal Agent States for Decision Making in Football Tactics [0.9207076627649226]
ルールベースのモデルは専門家の知識と一致するが、すべての選手の状態を十分に考慮していない。提案手法は,ボールホルダ電位受信機の両方に対する解釈可能な状態変数を定義する。解析の結果,選手とボールの間の距離と選手の空間スコアが,パスを成功させる上で重要な要因であることが判明した。
論文参考訳（メタデータ） (2025-06-20T02:37:52Z)
SoccerChat: Integrating Multimodal Data for Enhanced Soccer Game Understanding [44.04695944511487]
SoccerChatは、ビジュアルデータとテキストデータを統合して、サッカービデオの理解を強化した会話型AIフレームワークである。我々は,サッカーイベント理解において,行動分類と審判決定タスクについて,サッカーChatのベンチマークを行い,その性能を実証した。我々の発見は、サッカー分析の進歩におけるマルチモーダル統合の重要性を強調し、よりインタラクティブで説明可能なAI駆動スポーツ分析への道を開いた。
論文参考訳（メタデータ） (2025-05-22T13:01:51Z)
Multi-Agent System for Comprehensive Soccer Understanding [56.28536879015841]
我々は,最初の大規模マルチモーダルサッカー知識基盤であるサッカーウィキを構築した。サッカーベンチは、サッカーに特化した最大かつ最も包括的なベンチマークである。複雑なサッカー質問を分解する新しいマルチエージェントシステムである SoccerAgent を紹介する。
論文参考訳（メタデータ） (2025-05-06T17:59:31Z)
Towards Universal Soccer Video Understanding [58.889409980618396]
本稿では,サッカー理解のための総合的マルチモーダルフレームワークを提案する。これまでで最大のマルチモーダルサッカーデータセットである SoccerReplay-1988 を紹介する。サッカービデオにまたがる時間的情報を活用し、様々な下流タスクに優れる高度なサッカー特化視覚情報であるMatchVisionを提示する。
論文参考訳（メタデータ） (2024-12-02T18:58:04Z)
Towards AI-Powered Video Assistant Referee System (VARS) for Association Football [58.04352163544319]
Video Assistant Referee (VAR)は、バックステージの審判が複数の視点からピッチ上のインシデントをレビューできるようにするイノベーションである。 VARは現在、高価なインフラと世界中の審判の欠如のために、プロリーグに限られている。マルチビュービデオ解析における最新の知見を活用する半自動ビデオアシスタント参照システム(VARS)を提案する。
論文参考訳（メタデータ） (2024-07-17T11:09:03Z)
Deep Understanding of Soccer Match Videos [20.783415560412003]
サッカーは世界中で最も人気のあるスポーツの1つであり、主要な試合で頻繁に放送される。本システムでは, サッカーボール, 選手, 審判などの重要な物体を検知できる。また、プレイヤーとボールの動きを追跡し、プレイヤーの番号を認識し、シーンを分類し、ゴールキックのようなハイライトを識別する。
論文参考訳（メタデータ） (2024-07-11T05:54:13Z)
VARS: Video Assistant Referee System for Automated Soccer Decision Making from Multiple Views [70.70161449930127]
Video Assistant Refereeは協会サッカーに革命をもたらし、審判がピッチ上のインシデントをレビューできるようにする。しかし、多くの国での審判の欠如とVARインフラの高コストのため、プロリーグのみがその恩恵を受けることができる。サッカーの意思決定を自動化するビデオアシスタント参照システム(VARS)を提案する。
論文参考訳（メタデータ） (2023-04-10T14:33:05Z)
GOAL: A Challenging Knowledge-grounded Video Captioning Benchmark for Real-time Soccer Commentary Generation [75.60413443783953]
我々は,KGVC(Knowledge-grounded Video Captioning)として新たなタスク設定を提案するための,8.9k以上のサッカービデオクリップ,22kの文,42kの知識トリプルのベンチマークであるGOALを提案する。私たちのデータとコードはhttps://github.com/THU-KEG/goal.orgで公開されています。
論文参考訳（メタデータ） (2023-03-26T08:43:36Z)
Evaluating Soccer Player: from Live Camera to Deep Reinforcement Learning [0.0]
オープンソースのプレイヤー追跡モデルと、Deep Reinforcement Learningのみに基づいてこれらのプレイヤーを評価する新しいアプローチの2つの部分のソリューションを紹介します。私達の追跡モデルは私達がまた解放するデータセットの監視された方法で訓練され、私達の評価モデルは仮想サッカーゲームのシミュレーションだけに頼ります。新たなアプローチであるExpected Discounted Goal(EDG)は、チームが特定の状態から獲得または達成できる目標の数を表します。
論文参考訳（メタデータ） (2021-01-13T23:26:17Z)
SoccerNet-v2: A Dataset and Benchmarks for Holistic Understanding of Broadcast Soccer Videos [71.72665910128975]
SoccerNet-v2 は SoccerNet ビデオデータセット用の手動アノテーションの大規模なコーパスである。 SoccerNetの500の未トリミングサッカービデオの中で、約300万のアノテーションをリリースしています。サッカーの領域における現在のタスクを拡張し、アクションスポッティング、カメラショットセグメンテーション、境界検出を含む。
論文参考訳（メタデータ） (2020-11-26T16:10:16Z)
Game Plan: What AI can do for Football, and What Football can do for AI [83.79507996785838]
予測的および規範的フットボール分析は、統計学習、ゲーム理論、コンピュータビジョンの交差点における新たな発展と進歩を必要とする。フットボール分析は、サッカー自体のゲームを変えるだけでなく、この領域がAIの分野で何を意味するのかという観点からも、非常に価値の高いゲームチェンジャーであることを示す。
論文参考訳（メタデータ） (2020-11-18T10:26:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。