論文の概要: Double Deep Q-Learning in Opponent Modeling
- arxiv url: http://arxiv.org/abs/2211.15384v1
- Date: Thu, 24 Nov 2022 06:07:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 17:54:47.889683
- Title: Double Deep Q-Learning in Opponent Modeling
- Title(参考訳): 対向モデリングにおけるダブルディープq学習
- Authors: Yangtianze Tao and John Doe
- Abstract要約: 競合するアジェンダを持つ二次エージェントがメソッドを変更するマルチエージェントシステムも、反対のモデリングを必要とする。
本研究では、Double Deep Q-Networks (DDQN) を用いて、メインエージェントとセカンダリエージェントの戦術をシミュレートする。
対戦型モデリング設定では、様々な対戦型戦略パターンを特定するためにMixture-of-Expertsアーキテクチャが使用される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent systems in which secondary agents with conflicting agendas also
alter their methods need opponent modeling. In this study, we simulate the main
agent's and secondary agents' tactics using Double Deep Q-Networks (DDQN) with
a prioritized experience replay mechanism. Then, under the opponent modeling
setup, a Mixture-of-Experts architecture is used to identify various opponent
strategy patterns. Finally, we analyze our models in two environments with
several agents. The findings indicate that the Mixture-of-Experts model, which
is based on opponent modeling, performs better than DDQN.
- Abstract(参考訳): 競合するアジェンダを持つ二次エージェントがメソッドを変更するマルチエージェントシステムも、相手モデリングを必要とする。
本研究では,二層深層q-networks (ddqn) を用いた主エージェントと二次エージェントの戦術を,優先順位付けされた経験再生機構を用いてシミュレートする。
そして、対戦相手モデリング設定の下で、様々な対戦相手戦略パターンを特定するためにMixture-of-Expertsアーキテクチャを使用する。
最後に、複数のエージェントで2つの環境でモデルを分析する。
その結果, DDQNよりも, 対戦モデルに基づくMixture-of-Expertsモデルの方が優れた性能を示した。
関連論文リスト
- Keep on Swimming: Real Attackers Only Need Partial Knowledge of a Multi-Model System [0.0]
本稿では,マルチモデルシステム全体に対する敵攻撃を行う手法を提案する。
私たちの知る限り、これはこの脅威モデルのために特別に設計された最初の攻撃です。
論文 参考訳(メタデータ) (2024-10-30T22:23:16Z) - xLAM: A Family of Large Action Models to Empower AI Agent Systems [111.5719694445345]
AIエージェントタスク用に設計された大規模なアクションモデルであるxLAMをリリースする。
xLAMは、複数のエージェント能力ベンチマークで例外的なパフォーマンスを提供する。
論文 参考訳(メタデータ) (2024-09-05T03:22:22Z) - EMR-Merging: Tuning-Free High-Performance Model Merging [55.03509900949149]
Elect, Mask & Rescale-Merging (EMR-Merging) は既存のマージ手法と比較して優れた性能を示した。
EMR-Mergingはチューニング不要なので、データアベイラビリティや追加のトレーニングは必要ありません。
論文 参考訳(メタデータ) (2024-05-23T05:25:45Z) - Jointly Training and Pruning CNNs via Learnable Agent Guidance and Alignment [69.33930972652594]
本稿では,CNNモデルの重みと構造的プーン構造を協調的に学習するための新しい構造的プルーニング手法を提案する。
本手法の中核となる要素は強化学習(RL)エージェントであり,その動作がCNNモデルの階層のプルーニング比を決定する。
我々は,モデルの重みとエージェントのポリシーを反復的に訓練し,共同訓練と刈り取りを行う。
論文 参考訳(メタデータ) (2024-03-28T15:22:29Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
拡散モデル(DM)は、最近オフライン強化学習を含む様々なシナリオで大きな成功を収めた。
この問題に対処する新しい生成型マルチエージェント学習フレームワークであるMADiffを提案する。
本実験は,マルチエージェント学習タスクにおけるベースラインアルゴリズムと比較して,MADiffの優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - Decision-making with Speculative Opponent Models [10.594910251058087]
分散応答支援型マルチエージェントアクター・クリティカル(DOMAC)について紹介する。
DOMACは、ローカル情報(例えば、制御されたエージェントの観察、行動、報酬)のみに依存する最初の投機的相手モデリングアルゴリズムである。
論文 参考訳(メタデータ) (2022-11-22T01:29:47Z) - MetaQA: Combining Expert Agents for Multi-Skill Question Answering [49.35261724460689]
マルチデータセットモデルの有望な結果にもかかわらず、いくつかのドメインやQAフォーマットは特定のアーキテクチャを必要とするかもしれません。
本稿では,専門家エージェントと,質問,回答予測,回答予測信頼度スコアを考慮した,新しい,柔軟な,学習効率の高いアーキテクチャを組み合わせることを提案する。
論文 参考訳(メタデータ) (2021-12-03T14:05:52Z) - Multi-Agent Collaboration via Reward Attribution Decomposition [75.36911959491228]
本稿では,StarCraftのマルチエージェントチャレンジにおいて,最先端のパフォーマンスを実現するコラボレーション型Q-ラーニング(CollaQ)を提案する。
CollaQは様々なStarCraft属性マップで評価され、既存の最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-16T17:42:11Z) - Pareto-Optimal Bit Allocation for Collaborative Intelligence [39.11380888887304]
コラボレーションインテリジェンス(CI)は、人工知能(AI)ベースのサービスをモバイル/エッジデバイスにデプロイするための、有望なフレームワークとして登場した。
本稿では,マルチストリームCIシステムにおける特徴符号化のためのビット割り当てについて検討する。
論文 参考訳(メタデータ) (2020-09-25T20:48:33Z) - Learning to Model Opponent Learning [11.61673411387596]
マルチエージェント強化学習(MARL: Multi-Agent Reinforcement Learning)は、一組の共存エージェントが相互とその環境と相互作用する設定を考える。
これは、通常、収束が定常環境の仮定に依存する値関数ベースのアルゴリズムにとって大きな課題となる。
我々は、モデルポンポント学習(LeMOL)と呼ばれる、対戦者の学習力学をモデル化するための新しいアプローチを開発する。
論文 参考訳(メタデータ) (2020-06-06T17:19:04Z) - Variational Autoencoders for Opponent Modeling in Multi-Agent Systems [9.405879323049659]
マルチエージェントシステムは、共有環境における複数のエージェントの相互作用から生じる複雑な振る舞いを示す。
本研究は,マルチエージェントシステムにおけるエージェントの制御に関心を持ち,ポリシーを定めているエージェントとのインタラクションをうまく学習する。
他のエージェント(反対者)の振る舞いをモデル化することは、システム内のエージェントの相互作用を理解するのに不可欠である。
論文 参考訳(メタデータ) (2020-01-29T13:38:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。