Fugu-MT 論文翻訳(概要): baller2vec++: A Look-Ahead Multi-Entity Transformer For Modeling Coordinated Agents

論文の概要: baller2vec++: A Look-Ahead Multi-Entity Transformer For Modeling Coordinated Agents

arxiv url: http://arxiv.org/abs/2104.11980v1
Date: Sat, 24 Apr 2021 16:20:47 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-27 14:22:39.225356
Title: baller2vec++: A Look-Ahead Multi-Entity Transformer For Modeling Coordinated Agents
Title（参考訳）: Baller2vec++: 協調エージェントをモデル化するためのルックアヘッドマルチエンティティトランスフォーマー
Authors: Michael A. Alcorn, Anh Nguyen
Abstract要約: baller2vec++は,協調エージェントを効果的にモデル化するマルチエンティティトランスフォーマである。 Baller2vec++は、シミュレーションされたおもちゃのデータセットで完璧に調整されたエージェントの振る舞いをエミュレートすることを学ぶことができる。
参考スコア（独自算出の注目度）: 17.352818121007576
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In many multi-agent spatiotemporal systems, the agents are under the influence of shared, unobserved variables (e.g., the play a team is executing in a game of basketball). As a result, the trajectories of the agents are often statistically dependent at any given time step; however, almost universally, multi-agent models implicitly assume the agents' trajectories are statistically independent at each time step. In this paper, we introduce baller2vec++, a multi-entity Transformer that can effectively model coordinated agents. Specifically, baller2vec++ applies a specially designed self-attention mask to a mixture of location and "look-ahead" trajectory sequences to learn the distributions of statistically dependent agent trajectories. We show that, unlike baller2vec (baller2vec++'s predecessor), baller2vec++ can learn to emulate the behavior of perfectly coordinated agents in a simulated toy dataset. Additionally, when modeling the trajectories of professional basketball players, baller2vec++ outperforms baller2vec by a wide margin.
Abstract（参考訳）: 多くのマルチエージェントの時空間システムでは、エージェントは共有変数(例えば、チームがバスケットボールの試合で実行しているプレー)の影響を受けている。結果として、エージェントの軌道はしばしば任意の時間ステップで統計的に依存するが、概して、マルチエージェントモデルはエージェントの軌道は各時間ステップで統計的に独立であると暗黙的に仮定する。本稿では,コーディネートエージェントを効果的にモデル化できるマルチエンティティトランスフォーマであるballer2vec++を紹介する。特に、Baller2vec++は、統計的に依存するエージェント軌跡の分布を学習するために、ロケーションと"ルックアヘッド"トラジェクトリシーケンスの混合に特別に設計されたセルフアテンションマスクを適用している。 baller2vec(baller2vec++の前身)とは異なり、baller2vec++は完全な調整されたエージェントの振る舞いをシミュレートされたトイデータセットでエミュレートすることを学ぶことができる。さらに、プロバスケットボール選手の軌道をモデル化するとき、baller2vec++はballer2vecをはるかに上回っている。

関連論文リスト

APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay [86.01901238059261]
APIGen-MTは検証可能で多様なマルチターンエージェントデータを生成するフレームワークである。 xLAM-2-fc-r 級数で 1B から 70B のパラメータを持つモデル群を訓練する。我々のモデルは、$tau$-benchとBFCLベンチマークでGPT-4oやClaude 3.5のようなフロンティアモデルより優れている。
論文参考訳（メタデータ） (2025-04-04T17:13:57Z)
STEVE: A Step Verification Pipeline for Computer-use Agent Training [84.24814828303163]
STEVEは、コンピュータ使用エージェントトレーニングのためのステップ検証パイプラインである。 GPT-4oは、動作実行前後の画面に基づいて、軌跡の各ステップの正当性を検証するために使用される。我々のエージェントは、軌道内での正と負の両方の作用を利用して微調整を監督する。
論文参考訳（メタデータ） (2025-03-16T14:53:43Z)
TranSPORTmer: A Holistic Approach to Trajectory Understanding in Multi-Agent Sports [28.32714256545306]
TranSportmerは、これらすべてのタスクに対処できる統合トランスフォーマーベースのフレームワークである。時間的ダイナミクスと社会的相互作用を同変的に効果的に捉える。プレイヤー予測、プレイヤー予測・インプット、ボール推論、ボールインプットにおいて、最先端のタスク固有モデルより優れている。
論文参考訳（メタデータ） (2024-10-23T11:35:44Z)
xLAM: A Family of Large Action Models to Empower AI Agent Systems [111.5719694445345]
AIエージェントタスク用に設計された大規模なアクションモデルであるxLAMをリリースする。 xLAMは、複数のエージェント能力ベンチマークで例外的なパフォーマンスを提供する。
論文参考訳（メタデータ） (2024-09-05T03:22:22Z)
Deciphering Movement: Unified Trajectory Generation Model for Multi-Agent [53.637837706712794]
任意の軌道をマスク入力として処理する統一軌道生成モデルUniTrajを提案する。具体的には,空間特徴抽出のためのトランスフォーマーエンコーダ内に埋め込まれたゴースト空間マスキング(GSM)モジュールを導入する。バスケットボール-U,サッカー-U,サッカー-Uの3つの実用的なスポーツゲームデータセットをベンチマークして評価を行った。
論文参考訳（メタデータ） (2024-05-27T22:15:23Z)
Ball Trajectory Inference from Multi-Agent Sports Contexts Using Set Transformer and Hierarchical Bi-LSTM [18.884300680050316]
本稿では,ボールトラッキングに代わる費用対効果として,選手軌道からの球軌道推定フレームワークを提案する。実験の結果,本モデルでは,自然かつ正確な軌道と,許容可能な球の保持を同時に行うことができることがわかった。提案するフレームワークの実用的応用には,トラジェクティブ・インプットの欠如,半自動パスアノテーション,マッチブロードキャストのための自動ズームイン,保持可能な性能指標の算出などがある。
論文参考訳（メタデータ） (2023-06-14T02:19:59Z)
MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
拡散モデル(DM)は、最近オフライン強化学習を含む様々なシナリオで大きな成功を収めた。この問題に対処する新しい生成型マルチエージェント学習フレームワークであるMADiffを提案する。本実験は,マルチエージェント学習タスクにおけるベースラインアルゴリズムと比較して,MADiffの優れた性能を示す。
論文参考訳（メタデータ） (2023-05-27T02:14:09Z)
AgentFormer: Agent-Aware Transformers for Socio-Temporal Multi-Agent Forecasting [25.151713845738335]
我々は、時間と社会的次元を共同でモデル化する新しいトランスフォーマー、AgentFormerを提案する。エージェントフォーマに基づいて,任意のエージェントの特徴に任意の時間ステップで対応可能なマルチエージェント軌道予測モデルを提案する。提案手法は,歩行者および自律運転用データセットにおける技術状況を大幅に改善する。
論文参考訳（メタデータ） (2021-03-25T17:59:01Z)
baller2vec: A Multi-Entity Transformer For Multi-Agent Spatiotemporal Modeling [17.352818121007576]
マルチエージェント・テンポラリ・モデリングは,アルゴリズム設計の観点からも,計算の観点からも難しい課題である。本稿では,標準トランスフォーマーの多元性一般化である Baller2vec について紹介する。バスケットボールに関連する2つのタスクを訓練し,マルチエージェント・テンポラル・モデリングにおける Baller2vec の有効性を検証した。
論文参考訳（メタデータ） (2021-02-05T17:02:04Z)
Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。 CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文参考訳（メタデータ） (2020-10-16T17:42:11Z)
SMART: Simultaneous Multi-Agent Recurrent Trajectory Prediction [72.37440317774556]
本稿では,将来の軌道予測における2つの重要な課題に対処する手法を提案する。エージェントの数に関係なく、トレーニングデータと予測と一定時間の推測の両方において、マルチモーダリティ。
論文参考訳（メタデータ） (2020-07-26T08:17:10Z)
Distributed Reinforcement Learning for Cooperative Multi-Robot Object Manipulation [53.262360083572005]
強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクの検討分散近似RL(DA-RL)とゲーム理論RL(GT-RL)の2つの分散マルチエージェントRLアプローチを提案する。本稿では, DA-RL と GT-RL を多エージェントシステムに適用し, 大規模システムへの拡張が期待される。
論文参考訳（メタデータ） (2020-03-21T00:43:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。