論文の概要: baller2vec++: A Look-Ahead Multi-Entity Transformer For Modeling
Coordinated Agents
- arxiv url: http://arxiv.org/abs/2104.11980v1
- Date: Sat, 24 Apr 2021 16:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-27 14:22:39.225356
- Title: baller2vec++: A Look-Ahead Multi-Entity Transformer For Modeling
Coordinated Agents
- Title(参考訳): Baller2vec++: 協調エージェントをモデル化するためのルックアヘッドマルチエンティティトランスフォーマー
- Authors: Michael A. Alcorn, Anh Nguyen
- Abstract要約: baller2vec++は,協調エージェントを効果的にモデル化するマルチエンティティトランスフォーマである。
Baller2vec++は、シミュレーションされたおもちゃのデータセットで完璧に調整されたエージェントの振る舞いをエミュレートすることを学ぶことができる。
- 参考スコア(独自算出の注目度): 17.352818121007576
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many multi-agent spatiotemporal systems, the agents are under the
influence of shared, unobserved variables (e.g., the play a team is executing
in a game of basketball). As a result, the trajectories of the agents are often
statistically dependent at any given time step; however, almost universally,
multi-agent models implicitly assume the agents' trajectories are statistically
independent at each time step. In this paper, we introduce baller2vec++, a
multi-entity Transformer that can effectively model coordinated agents.
Specifically, baller2vec++ applies a specially designed self-attention mask to
a mixture of location and "look-ahead" trajectory sequences to learn the
distributions of statistically dependent agent trajectories. We show that,
unlike baller2vec (baller2vec++'s predecessor), baller2vec++ can learn to
emulate the behavior of perfectly coordinated agents in a simulated toy
dataset. Additionally, when modeling the trajectories of professional
basketball players, baller2vec++ outperforms baller2vec by a wide margin.
- Abstract(参考訳): 多くのマルチエージェントの時空間システムでは、エージェントは共有変数(例えば、チームがバスケットボールの試合で実行しているプレー)の影響を受けている。
結果として、エージェントの軌道はしばしば任意の時間ステップで統計的に依存するが、概して、マルチエージェントモデルはエージェントの軌道は各時間ステップで統計的に独立であると暗黙的に仮定する。
本稿では,コーディネートエージェントを効果的にモデル化できるマルチエンティティトランスフォーマであるballer2vec++を紹介する。
特に、Baller2vec++は、統計的に依存するエージェント軌跡の分布を学習するために、ロケーションと"ルックアヘッド"トラジェクトリシーケンスの混合に特別に設計されたセルフアテンションマスクを適用している。
baller2vec(baller2vec++の前身)とは異なり、baller2vec++は完全な調整されたエージェントの振る舞いをシミュレートされたトイデータセットでエミュレートすることを学ぶことができる。
さらに、プロバスケットボール選手の軌道をモデル化するとき、baller2vec++はballer2vecをはるかに上回っている。
関連論文リスト
- Ball Trajectory Inference from Multi-Agent Sports Contexts Using Set
Transformer and Hierarchical Bi-LSTM [18.884300680050316]
本稿では,ボールトラッキングに代わる費用対効果として,選手軌道からの球軌道推定フレームワークを提案する。
実験の結果,本モデルでは,自然かつ正確な軌道と,許容可能な球の保持を同時に行うことができることがわかった。
提案するフレームワークの実用的応用には,トラジェクティブ・インプットの欠如,半自動パスアノテーション,マッチブロードキャストのための自動ズームイン,保持可能な性能指標の算出などがある。
論文 参考訳(メタデータ) (2023-06-14T02:19:59Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [82.59166059130702]
拡散モデル(DM)は,最近オフライン強化学習を含む様々なシナリオで大きな成功を収めている。
この問題に対処する新しい生成型マルチエージェント学習フレームワークであるMADiffを提案する。
本実験は,マルチエージェント学習タスクにおけるベースラインアルゴリズムと比較して,MADiffの優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Multi-Game Decision Transformers [49.257185338595434]
そこで本研究では,1つのトランスフォーマーモデルを用いて,最大46個のAtariゲーム群を,人間に近いパフォーマンスで同時にプレイ可能であることを示す。
オンラインやオフラインのRL手法や行動クローンなど,マルチゲーム設定におけるいくつかのアプローチを比較した。
マルチゲーム決定変換モデルは、最高のスケーラビリティとパフォーマンスを提供します。
論文 参考訳(メタデータ) (2022-05-30T16:55:38Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - AgentFormer: Agent-Aware Transformers for Socio-Temporal Multi-Agent
Forecasting [25.151713845738335]
我々は、時間と社会的次元を共同でモデル化する新しいトランスフォーマー、AgentFormerを提案する。
エージェントフォーマに基づいて,任意のエージェントの特徴に任意の時間ステップで対応可能なマルチエージェント軌道予測モデルを提案する。
提案手法は,歩行者および自律運転用データセットにおける技術状況を大幅に改善する。
論文 参考訳(メタデータ) (2021-03-25T17:59:01Z) - baller2vec: A Multi-Entity Transformer For Multi-Agent Spatiotemporal
Modeling [17.352818121007576]
マルチエージェント・テンポラリ・モデリングは,アルゴリズム設計の観点からも,計算の観点からも難しい課題である。
本稿では,標準トランスフォーマーの多元性一般化である Baller2vec について紹介する。
バスケットボールに関連する2つのタスクを訓練し,マルチエージェント・テンポラル・モデリングにおける Baller2vec の有効性を検証した。
論文 参考訳(メタデータ) (2021-02-05T17:02:04Z) - A Graph Attention Based Approach for Trajectory Prediction in
Multi-agent Sports Games [4.29972694729078]
本研究では,複数の協調エージェントを持つチームの戦略を学習できる空間-時間軌道予測手法を提案する。
特に,グラフに基づく注意モデルを用いてエージェントの依存性を学習する。
2つの異なるスポーツゲームデータセットに対するアプローチの有効性と有効性を示す。
論文 参考訳(メタデータ) (2020-12-18T21:51:43Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z) - SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。
エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文 参考訳(メタデータ) (2020-07-26T08:17:10Z) - Distributed Reinforcement Learning for Cooperative Multi-Robot Object
Manipulation [53.262360083572005]
強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクの検討
分散近似RL(DA-RL)とゲーム理論RL(GT-RL)の2つの分散マルチエージェントRLアプローチを提案する。
本稿では, DA-RL と GT-RL を多エージェントシステムに適用し, 大規模システムへの拡張が期待される。
論文 参考訳(メタデータ) (2020-03-21T00:43:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。