論文の概要: X-Ego: Acquiring Team-Level Tactical Situational Awareness via Cross-Egocentric Contrastive Video Representation Learning
- arxiv url: http://arxiv.org/abs/2510.19150v1
- Date: Wed, 22 Oct 2025 00:48:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:14.83488
- Title: X-Ego: Acquiring Team-Level Tactical Situational Awareness via Cross-Egocentric Contrastive Video Representation Learning
- Title(参考訳): X-Ego:クロスエゴセントリックなコントラストビデオ表現学習によるチームレベルの戦術的状況認識の獲得
- Authors: Yunzhe Wang, Soham Hans, Volkan Ustun,
- Abstract要約: X-Ego-CSは、人気のあるeスポーツゲームCounter-Strike 2の45のプロレベル試合の124時間のゲームプレイ映像からなるベンチマークデータセットである。
X-Ego-CSは、すべてのプレイヤーのファーストパーソン視点とステートアクション軌跡を同期的にキャプチャするクロスエゴセントリックなビデオストリームを提供する。
我々は,チームメイトの自我中心の視覚ストリームを調整し,チームレベルの状況認識を個人の視点から促進するクロスエゴコントラスト学習(CECL)を提案する。
- 参考スコア(独自算出の注目度): 1.1765015608581086
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human team tactics emerge from each player's individual perspective and their ability to anticipate, interpret, and adapt to teammates' intentions. While advances in video understanding have improved the modeling of team interactions in sports, most existing work relies on third-person broadcast views and overlooks the synchronous, egocentric nature of multi-agent learning. We introduce X-Ego-CS, a benchmark dataset consisting of 124 hours of gameplay footage from 45 professional-level matches of the popular e-sports game Counter-Strike 2, designed to facilitate research on multi-agent decision-making in complex 3D environments. X-Ego-CS provides cross-egocentric video streams that synchronously capture all players' first-person perspectives along with state-action trajectories. Building on this resource, we propose Cross-Ego Contrastive Learning (CECL), which aligns teammates' egocentric visual streams to foster team-level tactical situational awareness from an individual's perspective. We evaluate CECL on a teammate-opponent location prediction task, demonstrating its effectiveness in enhancing an agent's ability to infer both teammate and opponent positions from a single first-person view using state-of-the-art video encoders. Together, X-Ego-CS and CECL establish a foundation for cross-egocentric multi-agent benchmarking in esports. More broadly, our work positions gameplay understanding as a testbed for multi-agent modeling and tactical learning, with implications for spatiotemporal reasoning and human-AI teaming in both virtual and real-world domains. Code and dataset are available at https://github.com/HATS-ICT/x-ego.
- Abstract(参考訳): 人間のチーム戦術は、各プレイヤーの個人的視点と、チームメイトの意図を予測し、解釈し、適応する能力から生まれる。
ビデオ理解の進歩はスポーツにおけるチームインタラクションのモデリングを改善する一方で、既存の作業の多くは第三者の放送ビューに依存し、マルチエージェント学習の同期的でエゴセントリックな性質を見落としている。
X-Ego-CSは、複雑な3D環境下でのマルチエージェント意思決定を容易にするために設計された、人気のあるeスポーツゲームCounter-Strike 2の45のプロレベルの試合の124時間のゲームプレイ映像からなるベンチマークデータセットである。
X-Ego-CSは、すべてのプレイヤーのファーストパーソン視点とステートアクショントラジェクトリを同期的にキャプチャするクロスエゴセントリックなビデオストリームを提供する。
このリソースを基盤として,チームメイトの自我中心の視覚ストリームを調整し,個人の視点からのチームレベルの戦術的状況認識を促進するクロスエゴコントラスト学習(CECL)を提案する。
我々は、CECLをチームメイト対応位置予測タスクで評価し、最先端のビデオエンコーダを用いた1対1の視点から、チームメイトと対戦相手の両方の位置を推測するエージェントの有効性を実証した。
X-Ego-CSとCECLは共に、エスポートにおけるクロスエゴセントリックなマルチエージェントベンチマークの基礎を確立した。
より広範に、我々の研究はゲームプレイ理解をマルチエージェントモデリングと戦術学習のためのテストベッドとして位置づけており、仮想と現実世界の両方の領域における時空間推論と人間とAIの連携に影響を及ぼす。
コードとデータセットはhttps://github.com/HATS-ICT/x-ego.comで公開されている。
関連論文リスト
- Player-Team Heterogeneous Interaction Graph Transformer for Soccer Outcome Prediction [8.197004730382396]
HIGFormerは,サッカー結果予測のための新しいグラフ強化トランスフォーマーベースディープラーニングモデルである。
きめ細かいプレイヤーダイナミクスとハイレベルなチームインタラクションの両方をキャプチャします。
大規模な実世界のサッカーデータセットであるWyScout Open Accessデータセットの実験では、HIGFormerが予測精度において既存の手法を大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2025-07-14T06:43:36Z) - Generalizable Agent Modeling for Agent Collaboration-Competition Adaptation with Multi-Retrieval and Dynamic Generation [19.74776726500979]
ひとつのエージェントを新しいマルチエージェントシステムに適用することは、課題をもたらし、さまざまなタスク、環境、未知のチームメイトや相手とのインタラクションを調整する必要がある。
本稿では,多種多様なシナリオにまたがってエージェントを一般化するためのエージェント評価を行う,より包括的なエージェント協調適応手法を提案する。
ACCAでは、エージェントはタスクや環境の変化を調整し、目に見えないチームメイトと協力し、未知の相手と競う。
論文 参考訳(メタデータ) (2025-06-20T03:28:18Z) - Diffusion Stochastic Learning Over Adaptive Competing Networks [28.974218453862825]
本稿では,協調エージェントのネットワークで構成される2つのチーム間の動的ゲームについて検討する。
本稿では,このネットワークゲームにおける2つの重要なクラスに対処する拡散学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-28T09:49:54Z) - From Broadcast to Minimap: Achieving State-of-the-Art SoccerNet Game State Reconstruction [0.19748373512880277]
ゲーム・ステート・レコンストラクション(GSR)は、サッカーのフィールドプレーヤ、ゴールキーパー、審判員、その他全ての個人を正確に追跡し、ローカライズする。
この能力により、コーチやアナリストはプレイヤーの動き、チーム形成、ゲームダイナミクスに関する実用的な洞察を導き出すことができる。
単一カメラのセットアップを用いて,選手を一括して追跡する,堅牢なエンドツーエンドパイプラインを提案する。
論文 参考訳(メタデータ) (2025-04-08T18:10:44Z) - AVA: Attentive VLM Agent for Mastering StarCraft II [56.07921367623274]
Intentive VLM Agent (AVA) は、人工エージェントの認識と人間のゲームプレイ体験を一致させるマルチモーダルのStarCraft IIエージェントである。
我々のエージェントは、ゲームプレイ中に人間の認知過程をより密にシミュレートするRGB視覚入力と自然言語観察を組み込むことにより、この制限に対処する。
論文 参考訳(メタデータ) (2025-03-07T12:54:25Z) - Learning Robot Soccer from Egocentric Vision with Deep Reinforcement Learning [17.906144781244336]
我々は,自己中心型RGBビジョンによる完全オンボード計算とセンシングにより,エンドツーエンドのロボットサッカーポリシーを訓練する。
本稿では,マルチエージェントロボットサッカーにおけるエンドツーエンドトレーニングの最初の実演を行う。
論文 参考訳(メタデータ) (2024-05-03T18:41:13Z) - From Motor Control to Team Play in Simulated Humanoid Football [56.86144022071756]
我々は、現実的な仮想環境でサッカーをするために、物理的にシミュレートされたヒューマノイドアバターのチームを訓練する。
一連の段階において、プレイヤーはまず、現実的な人間のような動きを実行するために、完全に関節化された身体を制御することを学習する。
その後、ドリブルやシューティングといった中級のサッカーのスキルを身につける。
最後に、彼らは他の人を意識し、チームとしてプレーし、ミリ秒のタイムスケールで低レベルのモーターコントロールのギャップを埋める。
論文 参考訳(メタデータ) (2021-05-25T20:17:10Z) - Coach-Player Multi-Agent Reinforcement Learning for Dynamic Team
Composition [88.26752130107259]
現実世界のマルチエージェントシステムでは、異なる能力を持つエージェントがチーム全体の目標を変更することなく参加または離脱する可能性がある。
この問題に取り組むコーチ・プレイヤー・フレームワーク「COPA」を提案します。
1)コーチと選手の両方の注意メカニズムを採用し、2)学習を正規化するための変動目標を提案し、3)コーチが選手とのコミュニケーションのタイミングを決定するための適応的なコミュニケーション方法を設計する。
論文 参考訳(メタデータ) (2021-05-18T17:27:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。