論文の概要: Predicting Plans and Actions in Two-Player Repeated Games
- arxiv url: http://arxiv.org/abs/2004.12480v1
- Date: Sun, 26 Apr 2020 21:03:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 13:55:20.515564
- Title: Predicting Plans and Actions in Two-Player Repeated Games
- Title(参考訳): 2人繰り返しゲームにおける計画と行動の予測
- Authors: Najma Mathema, Michael A. Goodrich, and Jacob W. Crandall
- Abstract要約: この研究は、繰り返しプレイゲームにおけるアクション、計画、意図を予測するアルゴリズムを導入する。
S# をモデルとして生成ベイズ的アプローチを構築し、2 × 2 の行列ゲームにおいてその関連性に協力することを学ぶ。
- 参考スコア(独自算出の注目度): 1.7324358447544175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial intelligence (AI) agents will need to interact with both other AI
agents and humans. Creating models of associates help to predict the modeled
agents' actions, plans, and intentions. This work introduces algorithms that
predict actions, plans and intentions in repeated play games, with providing an
exploration of algorithms. We form a generative Bayesian approach to model S#.
S# is designed as a robust algorithm that learns to cooperate with its
associate in 2 by 2 matrix games. The actions, plans and intentions associated
with each S# expert are identified from the literature, grouping the S# experts
accordingly, and thus predicting actions, plans, and intentions based on their
state probabilities. Two prediction methods are explored for Prisoners Dilemma:
the Maximum A Posteriori (MAP) and an Aggregation approach. MAP (~89% accuracy)
performed the best for action prediction. Both methods predicted plans of S#
with ~88% accuracy. Paired T-test shows that MAP performs significantly better
than Aggregation for predicting S#'s actions without cheap talk. Intention is
explored based on the goals of the S# experts; results show that goals are
predicted precisely when modeling S#. The obtained results show that the
proposed Bayesian approach is well suited for modeling agents in two-player
repeated games.
- Abstract(参考訳): 人工知能(AI)エージェントは、他のAIエージェントと人間の両方と対話する必要がある。
アソシエイトモデルの作成は、モデル化されたエージェントの行動、計画、意図を予測するのに役立つ。
この研究は、繰り返しプレイゲームにおけるアクション、計画、意図を予測するアルゴリズムを導入し、アルゴリズムの探索を提供する。
我々は、s#をモデル化する生成ベイズ的アプローチを形成する。
s# は 2 対 2 のマトリクスゲームでそのアソシエイトと協調することを学ぶロバストなアルゴリズムとして設計されている。
それぞれのS#専門家に関連する行動、計画、意図は文献から特定され、それに従ってS#専門家をグループ化し、その状態の確率に基づいて行動、計画、意図を予測する。
囚人ジレンマに対する2つの予測法が検討されている: 最大後肢 (map) と集約アプローチである。
MAP(約89%の精度)は行動予測に最適であった。
どちらの方法も88%の精度でs#の計画を予測する。
Paired T-testは、MAPが安価なトークなしでS#のアクションを予測するのに、Aggregationよりもはるかに優れていることを示している。
s#の専門家の目標に基づいて意図を探求する。その結果、s#をモデリングするときの目標を正確に予測できることが示されている。
その結果,提案手法は2プレイヤー繰り返しゲームにおけるモデリングエージェントに好適であることがわかった。
関連論文リスト
- A Best-of-Both Approach to Improve Match Predictions and Reciprocal Recommendations for Job Search [15.585641615174623]
本稿では、擬似マッチスコアを利用して、生産における相互推薦を改善するための、新規で実用的なソリューションを紹介し、実証する。
具体的には、実際のマッチングラベルと比較的不正確だが密なマッチング予測を組み合わせることで、より密で直接的な擬似マッチスコアを生成する。
我々の手法は、直接マッチング予測と2つの異なるモデルアプローチの両方の高レベルなアイデアを組み合わせることで、ベスト・オブ・ボス(BoB)アプローチと見なすことができる。
論文 参考訳(メタデータ) (2024-09-17T08:51:02Z) - SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction [37.461695201579914]
我々は,最小限の計算量で予測を洗練するために,SmartRefineというシナリオ適応型改良戦略を導入する。
SmartRefineは汎用的で柔軟なアプローチとして設計されており、ほとんどの最先端のモーション予測モデルにシームレスに統合することができる。
QCNetにSmartRefineを追加することで、提出時にArgoverse 2のリーダーボード(シングルエージェントトラック)で、すべてのアンサンブルフリーの作品をパフォーマンスします。
論文 参考訳(メタデータ) (2024-03-18T05:53:20Z) - ADAPT: Efficient Multi-Agent Trajectory Prediction with Adaptation [0.0]
ADAPTはダイナミックウェイトラーニングによってシーン内の全てのエージェントの軌道を共同で予測するための新しいアプローチである。
提案手法は, 単一エージェントと複数エージェントの設定において, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-26T13:41:51Z) - H-SAUR: Hypothesize, Simulate, Act, Update, and Repeat for Understanding
Object Articulations from Interactions [62.510951695174604]
The Hypothesize, Simulate, Act, Update, and Repeat (H-SAUR) is a probabilistic generative framework that generated hypotheses about objects articulate given input observed。
提案手法は,現在最先端のオブジェクト操作フレームワークよりも優れていることを示す。
我々は、学習に基づく視覚モデルから学習前の学習を統合することにより、H-SAURのテスト時間効率をさらに向上する。
論文 参考訳(メタデータ) (2022-10-22T18:39:33Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - You Mostly Walk Alone: Analyzing Feature Attribution in Trajectory
Prediction [52.442129609979794]
軌道予測のための最近の深層学習手法は有望な性能を示す。
そのようなブラックボックスモデルが実際にどのモデルを予測するために使うのかは、まだ不明である。
本稿では,モデル性能に対する異なるキューの貢献度を定量化する手法を提案する。
論文 参考訳(メタデータ) (2021-10-11T14:24:15Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z) - Online Bayesian Goal Inference for Boundedly-Rational Planning Agents [46.60073262357339]
本稿では,行動の最適シーケンスと非最適シーケンスの両方からエージェントの目標をオンラインで推測できるアーキテクチャを提案する。
我々のアーキテクチャモデルは、リプランニングによって検索と実行をインターリーブする有界な有界プランナーとして機能する。
我々は,これらのモデルのオンライン再計画仮定を利用するシーケンシャルモンテカルロアルゴリズムであるシーケンシャル逆計画探索(SIPS)を開発した。
論文 参考訳(メタデータ) (2020-06-13T01:48:10Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。