論文の概要: PlayBest: Professional Basketball Player Behavior Synthesis via Planning with Diffusion
- arxiv url: http://arxiv.org/abs/2306.04090v3
- Date: Tue, 16 Jul 2024 21:01:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-18 23:50:47.856415
- Title: PlayBest: Professional Basketball Player Behavior Synthesis via Planning with Diffusion
- Title(参考訳): PlayBest: 拡散型プランニングによるプロバスケットボール選手の行動合成
- Authors: Xiusi Chen, Wei-Yao Wang, Ziniu Hu, David Reynoso, Kun Jin, Mingyan Liu, P. Jeffrey Brantingham, Wei Wang,
- Abstract要約: 本稿ではプレイヤーの意思決定を改善する方法であるPlayBest(PLAYer BEhavior DynamicThesis)を紹介する。
本研究では,NBA選手の運動追跡データから,拡散確率モデルを拡張し,環境動態を学習する。
以上の結果から,このモデルは,効率的なプレーを実現する合理的なバスケットボールコースの創出に優れることが明らかとなった。
- 参考スコア(独自算出の注目度): 24.47841117058161
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dynamically planning in complex systems has been explored to improve decision-making in various domains. Professional basketball serves as a compelling example of a dynamic spatio-temporal game, encompassing context-dependent decision-making. However, processing the diverse on-court signals and navigating the vast space of potential actions and outcomes make it difficult for existing approaches to swiftly identify optimal strategies in response to evolving circumstances. In this study, we formulate the sequential decision-making process as a conditional trajectory generation process. Based on the formulation, we introduce PlayBest (PLAYer BEhavior SynThesis), a method to improve player decision-making. We extend the diffusion probabilistic model to learn challenging environmental dynamics from historical National Basketball Association (NBA) player motion tracking data. To incorporate data-driven strategies, an auxiliary value function is trained with corresponding rewards. To accomplish reward-guided trajectory generation, we condition the diffusion model on the value function via classifier-guided sampling. We validate the effectiveness of PlayBest through simulation studies, contrasting the generated trajectories with those employed by professional basketball teams. Our results reveal that the model excels at generating reasonable basketball trajectories that produce efficient plays. Moreover, the synthesized play strategies exhibit an alignment with professional tactics, highlighting the model's capacity to capture the intricate dynamics of basketball games.
- Abstract(参考訳): 複雑なシステムにおける動的計画は、様々な領域における意思決定を改善するために研究されている。
プロバスケットボールは、文脈に依存した意思決定を含む動的時空間ゲームの魅力的な例である。
しかし,様々なオンコート信号の処理や潜在的な行動や成果の膨大な空間のナビゲートは,進化する状況に対応する最適な戦略を迅速に特定することが困難である。
本研究では,条件付き軌道生成プロセスとして逐次決定過程を定式化する。
この定式化に基づき,プレイベスト (PLAYer BEhavior Synthesis) を導入する。
本研究では,NBA選手の運動追跡データから,拡散確率モデルを拡張し,環境動態を学習する。
データ駆動戦略を取り入れるために、補助値関数は対応する報酬で訓練される。
報奨誘導軌道生成を実現するため,分類器誘導サンプリングにより,値関数上の拡散モデルを条件とした。
本研究では,プロバスケットボールチームで採用されている選手と,生成された軌跡を対比し,シミュレーション研究によりPlayBestの有効性を検証した。
以上の結果から,このモデルは,効率的なプレーを実現する合理的なバスケットボールコースの創出に優れることが明らかとなった。
さらに、合成されたプレイ戦略はプロの戦術と一致しており、バスケットボールの試合の複雑なダイナミクスを捉えるためのモデルの能力を強調している。
関連論文リスト
- Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。
HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。
HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文 参考訳(メタデータ) (2024-06-12T08:48:06Z) - SportsNGEN: Sustained Generation of Realistic Multi-player Sports Gameplay [19.80390059667457]
本稿では,トランスフォーマーデコーダを用いたスポーツシミュレーションエンジンであるSportsNGENについて述べる。
プロテニス追跡データの大規模なデータベースをトレーニングすることにより,SportsNGENが生成したシミュレーションがラリーの結果を予測することができることを示す。
モデル出力サンプリングパラメータはシミュレーションリアリズムに不可欠であり,SportsNGENは確率論的に実データに適合していることを示す。
論文 参考訳(メタデータ) (2024-02-10T01:16:21Z) - ShuttleSHAP: A Turn-Based Feature Attribution Approach for Analyzing
Forecasting Models in Badminton [52.21869064818728]
バドミントンにおけるプレイヤー戦術予測のための深層学習アプローチは、部分的にはラリープレイヤの相互作用に関する効果的な推論に起因する有望なパフォーマンスを示している。
本稿では,Shapley値の変量に基づいてバドミントンにおける予測モデルを解析するためのターンベース特徴属性手法であるShuttleSHAPを提案する。
論文 参考訳(メタデータ) (2023-12-18T05:37:51Z) - Ball Trajectory Inference from Multi-Agent Sports Contexts Using Set
Transformer and Hierarchical Bi-LSTM [18.884300680050316]
本稿では,ボールトラッキングに代わる費用対効果として,選手軌道からの球軌道推定フレームワークを提案する。
実験の結果,本モデルでは,自然かつ正確な軌道と,許容可能な球の保持を同時に行うことができることがわかった。
提案するフレームワークの実用的応用には,トラジェクティブ・インプットの欠如,半自動パスアノテーション,マッチブロードキャストのための自動ズームイン,保持可能な性能指標の算出などがある。
論文 参考訳(メタデータ) (2023-06-14T02:19:59Z) - Lucy-SKG: Learning to Play Rocket League Efficiently Using Deep
Reinforcement Learning [0.0]
本稿では,Rocket Leagueをサンプル効率でプレイする方法を学習した強化学習ベースのモデルであるLucy-SKGを紹介する。
コントリビューションには、報酬分析と可視化ライブラリの開発、新しいパラメータ化可能な報酬形状関数、補助的ニューラルネットワークなどがある。
論文 参考訳(メタデータ) (2023-05-25T07:33:17Z) - Understanding why shooters shoot -- An AI-powered engine for basketball
performance profiling [70.54015529131325]
バスケットボールは、プレイスタイルやゲームダイナミクスなど、多くの変数によって規定されている。
パフォーマンスプロファイルが様々なプレイスタイルを反映できることは重要です。
プレイヤのパフォーマンスプロファイルをタイムリーに可視化するツールを提案する。
論文 参考訳(メタデータ) (2023-03-17T01:13:18Z) - Finding mixed-strategy equilibria of continuous-action games without
gradients using randomized policy networks [83.28949556413717]
グラデーションへのアクセスを伴わない連続アクションゲームのナッシュ平衡を近似的に計算する問題について検討する。
ニューラルネットワークを用いてプレイヤーの戦略をモデル化する。
本論文は、制約のない混合戦略と勾配情報のない一般的な連続アクションゲームを解決する最初の方法である。
論文 参考訳(メタデータ) (2022-11-29T05:16:41Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Dyna-T: Dyna-Q and Upper Confidence Bounds Applied to Trees [0.9137554315375919]
本稿ではDyna-Tという新しいアルゴリズムについて予備検討する。
強化学習(RL)では、計画エージェントは環境をモデルとして表現する。
より良いモデルを学ぶために、あるいは価値関数とポリシーを直接改善するために、経験を使うことができる。
論文 参考訳(メタデータ) (2022-01-12T15:06:30Z) - Learning to Play Imperfect-Information Games by Imitating an Oracle
Planner [77.67437357688316]
我々は、同時移動と大規模なステートアクションスペースでマルチプレイヤーの不完全な情報ゲームをプレイする学習を検討します。
我々のアプローチはモデルに基づく計画に基づいている。
我々は,Clash Royale と Pommerman のゲームにおいて,プランナーが効率的なプレイ戦略を発見することができることを示す。
論文 参考訳(メタデータ) (2020-12-22T17:29:57Z) - Multi-Modal Trajectory Prediction of NBA Players [14.735704310108101]
本稿では,プレイヤーのマルチモーダルな動作を捉える手法を提案する。
本手法は,マルチモーダル損失関数を用いて学習した複数の軌道とその確率を予測するLSTMアーキテクチャ上に構築される。
NBA追跡データ大きめの実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-08-18T11:35:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。