論文の概要: Common Data Format (CDF): A Standardized Format for Match-Data in Football (Soccer)
- arxiv url: http://arxiv.org/abs/2505.15820v2
- Date: Fri, 06 Jun 2025 07:34:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:42.987321
- Title: Common Data Format (CDF): A Standardized Format for Match-Data in Football (Soccer)
- Title(参考訳): 共通データフォーマット(CDF):サッカーにおけるマッチデータのための標準化フォーマット(Soccer)
- Authors: Gabriel Anzer, Kilian Arnsmeyer, Pascal Bauer, Joris Bekkers, Ulf Brefeld, Jesse Davis, Nicolas Evans, Matthias Kempe, Samuel J Robertson, Joshua Wyatt Smith, Jan Van Haaren,
- Abstract要約: 本研究の目的は,CDF(Common Data Format)と呼ばれる,サッカーデータの均一かつ標準化されたフォーマットを提案することである。
CDFは、マッチシートデータ、ビデオ映像、イベントデータ、追跡データ、およびメタデータの5種類のマッチングデータに対して、最小限のスキーマを定義している。
それは、提供されたデータが明確で、十分にコンテキスト化された(例えば、その証明は明確)ことを保証すること、そして、共通の下流分析タスクを可能にすることを目的としている。
- 参考スコア(独自算出の注目度): 11.43385683979596
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: During football matches, a variety of different parties (e.g., companies) each collect (possibly overlapping) data about the match ranging from basic information (e.g., starting players) to detailed positional data. This data is provided to clubs, federations, and other organizations who are increasingly interested in leveraging this data to inform their decision making. Unfortunately, analyzing such data pose significant barriers because each provider may (1) collect different data, (2) use different specifications even within the same category of data, (3) represent the data differently, and (4) delivers the data in a different manner (e.g., file format, protocol). Consequently, working with these data requires a significant investment of time and money. The goal of this work is to propose a uniform and standardized format for football data called the Common Data Format (CDF). The CDF specifies a minimal schema for five types of match data: match sheet data, video footage, event data, tracking data, and match meta data. It aims to ensure that the provided data is clear, sufficiently contextualized (e.g., its provenance is clear), and complete such that it enables common downstream analysis tasks. Concretely, this paper will detail the technical specifications of the CDF, the representational choices that were made to help ensure the clarity of the provided data, and a concrete approach for delivering data in the CDF.
- Abstract(参考訳): フットボールの試合中、様々なパーティ(例えば、会社)がそれぞれ、基本情報(例えば、開始者)から詳細な位置データまで、試合に関するデータを収集(おそらく重複)する。
このデータは、クラブ、フェデレーション、その他の組織に提供されます。
残念ながら、このようなデータを解析することは、(1)異なるデータを収集できる、(2)同じカテゴリのデータでも異なる仕様を使う、(3)異なるデータを表現できる、(4)異なる方法でデータを提供する(例えば、ファイルフォーマット、プロトコル)ため、大きな障壁となる。
そのため、これらのデータを扱うには、時間とお金のかなりの投資が必要になる。
本研究の目的は,CDF (Common Data Format) と呼ばれる,サッカーデータの統一的で標準化されたフォーマットを提案することである。
CDFは、マッチシートデータ、ビデオ映像、イベントデータ、追跡データ、およびメタデータの5種類のマッチングデータに対して、最小限のスキーマを定義している。
その目的は、提供されたデータが明確で、十分なコンテキスト化(例えば、その証明は明確)され、共通の下流分析タスクを可能にするように完成することにある。
具体的には、CDFの技術的仕様、提供されたデータの明確性を保証するための表現的選択、およびCDFでデータを提供するための具体的なアプローチについて詳述する。
関連論文リスト
- Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - Federated Learning Empowered by Generative Content [55.576885852501775]
フェデレートラーニング(FL)は、プライバシ保護方法でモデルのトレーニングに分散プライベートデータを活用可能にする。
本稿では,FedGCと呼ばれる新しいFLフレームワークを提案する。
我々は、さまざまなベースライン、データセット、シナリオ、モダリティをカバーする、FedGCに関する体系的な実証的研究を行う。
論文 参考訳(メタデータ) (2023-12-10T07:38:56Z) - A Review and Roadmap of Deep Causal Model from Different Causal
Structures and Representations [23.87336875544181]
我々は因果データを,定値データ,半定値データ,不定値データという3つのカテゴリに再定義する。
定値データとは、従来の因果的シナリオで使用される統計データであり、半定値データは、ディープラーニングにドイツのデータフォーマットのスペクトルを指す。
不確定データは、我々のデータフォームの進行から推定される創発的な研究領域である。
論文 参考訳(メタデータ) (2023-11-02T01:31:42Z) - Data Architecture for Digital Object Space Management Service (DOSM)
using DAT [1.8945921149936187]
この研究は、データの動き、データフォーマット、データ位置、データ処理(バッチまたはリアルタイム)、データストレージ技術、およびデータ上の主要な操作を記述することに焦点を当てている。
データアーキテクチャは、ソースから目的地へのデータフローを記述する複雑なタスクである。
論文 参考訳(メタデータ) (2023-06-22T14:22:56Z) - ASDOT: Any-Shot Data-to-Text Generation with Pretrained Language Models [82.63962107729994]
Any-Shot Data-to-Text (ASDOT)は、多様な設定に柔軟に適用可能な新しいアプローチである。
データ曖昧化と文の融合という2つのステップから構成される。
実験の結果, ASDOT はベースラインよりも顕著な改善が得られた。
論文 参考訳(メタデータ) (2022-10-09T19:17:43Z) - A Multi-Format Transfer Learning Model for Event Argument Extraction via
Variational Information Bottleneck [68.61583160269664]
イベント引数抽出(EAE)は、テキストから所定の役割を持つ引数を抽出することを目的としている。
変動情報のボトルネックを考慮したマルチフォーマット変換学習モデルを提案する。
3つのベンチマークデータセットに対して広範な実験を行い、EAE上での新たな最先端性能を得る。
論文 参考訳(メタデータ) (2022-08-27T13:52:01Z) - A Survey of Historical Document Image Datasets [2.8707038627097226]
本稿では,文書画像解析のための画像データセットの体系的な文献レビューを行う。
手書きの写本や初期の版画などの史料に焦点が当てられている。
歴史的文書分析のための適切なデータセットを見つけることは、異なる機械学習アルゴリズムを用いた研究を促進するための重要な前提条件である。
論文 参考訳(メタデータ) (2022-03-16T09:56:48Z) - Vertical Federated Learning without Revealing Intersection Membership [30.612650238615267]
Vertical Federated Learning (vFL)は、同じデータエンティティの異なる属性を持つ複数のパーティが共同でモデルをトレーニングすることを可能にする。
通常はプライベート・セット・インターセクション(PSI)によって達成される。
本稿では,PSU(Private Set Union)に基づくvFLフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-10T05:26:50Z) - Overcoming Noisy and Irrelevant Data in Federated Learning [13.963024590508038]
フェデレーション学習は、クライアントデバイスが収集したローカルデータから、機械学習モデルを分散的にトレーニングする効果的な方法である。
そこで我々は,小さなベンチマークデータセットに基づいてトレーニングされたベンチマークモデルを用いて,関連するデータを分散的に選択する手法を提案する。
提案手法の有効性は,多数のクライアントを持つシミュレーションシステムにおいて,複数の実世界の画像データセット上で評価される。
論文 参考訳(メタデータ) (2020-01-22T22:28:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。