論文の概要: An Overview of Multi-Agent Reinforcement Learning from Game Theoretical
Perspective
- arxiv url: http://arxiv.org/abs/2011.00583v3
- Date: Thu, 18 Mar 2021 01:43:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 23:48:40.032477
- Title: An Overview of Multi-Agent Reinforcement Learning from Game Theoretical
Perspective
- Title(参考訳): ゲーム理論から見たマルチエージェント強化学習の概観
- Authors: Yaodong Yang, Jun Wang
- Abstract要約: この研究は、ゲーム理論の観点から、現在の最先端のMARL技術について自己完結した評価を提供する。
MARLは複数のエージェントが同時に学習するマルチエージェントシステムにおける学習問題に対応する。
- 参考スコア(独自算出の注目度): 12.185870309965011
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Following the remarkable success of the AlphaGO series, 2019 was a booming
year that witnessed significant advances in multi-agent reinforcement learning
(MARL) techniques. MARL corresponds to the learning problem in a multi-agent
system in which multiple agents learn simultaneously. It is an
interdisciplinary domain with a long history that includes game theory, machine
learning, stochastic control, psychology, and optimisation. Although MARL has
achieved considerable empirical success in solving real-world games, there is a
lack of a self-contained overview in the literature that elaborates the game
theoretical foundations of modern MARL methods and summarises the recent
advances. In fact, the majority of existing surveys are outdated and do not
fully cover the recent developments since 2010. In this work, we provide a
monograph on MARL that covers both the fundamentals and the latest developments
in the research frontier. The goal of our monograph is to provide a
self-contained assessment of the current state-of-the-art MARL techniques from
a game theoretical perspective. We expect this work to serve as a stepping
stone for both new researchers who are about to enter this fast-growing domain
and existing domain experts who want to obtain a panoramic view and identify
new directions based on recent advances.
- Abstract(参考訳): alphagoシリーズの成功に続いて、2019年はマルチエージェント強化学習(marl)技術が大幅に進歩した年となった。
MARLは複数のエージェントが同時に学習するマルチエージェントシステムにおける学習問題に対応する。
ゲーム理論、機械学習、確率制御、心理学、最適化を含む長い歴史を持つ学際ドメインである。
MARLは現実世界のゲームを解く上で経験的な成功を収めてきたが、現代のMARL手法のゲーム理論の基礎を詳述し、最近の進歩を要約する自己完結した概要は文献に欠けている。
実際、既存の調査の大部分は時代遅れであり、2010年以降の最近の開発を完全にカバーしていない。
本稿では,研究フロンティアにおける基礎と最新の発展の両方を網羅した,MARLに関するモノグラフを提供する。
本研究の目的は,ゲーム理論の観点から,現在最先端のMARL技術の自己完結型評価を提供することである。
この研究は、この急速に成長する領域に参入しようとしている新しい研究者と、パノラマ図を取得して、最近の進歩に基づいて新しい方向を特定したい既存ドメインの専門家の両方にとって、足場となるものと期待している。
関連論文リスト
- Large Language Models for Generative Information Extraction: A Survey [93.28676955662002]
情報抽出は、平易な自然言語テキストから構造的知識を抽出することを目的としている。
生成型大規模言語モデル(LLM)は、テキストの理解と生成において顕著な能力を示した。
LLMは生成パラダイムに基づいたIEタスクに対して実行可能なソリューションを提供する。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - Federated Learning for Generalization, Robustness, Fairness: A Survey
and Benchmark [55.898771405172155]
フェデレートラーニングは、異なる当事者間のプライバシー保護コラボレーションのための有望なパラダイムとして登場した。
我々は,連合学習研究の重要かつ最近の展開を体系的に概観する。
論文 参考訳(メタデータ) (2023-11-12T06:32:30Z) - ALYMPICS: LLM Agents Meet Game Theory -- Exploring Strategic
Decision-Making with AI Agents [77.34720446306419]
Alympicsは、ゲーム理論の研究にLarge Language Model (LLM)エージェントを利用する、体系的なシミュレーションフレームワークである。
Alympicsは、複雑なゲーム理論の問題を研究するための汎用的なプラットフォームを作成する。
論文 参考訳(メタデータ) (2023-11-06T16:03:46Z) - A Survey on Large Language Model based Autonomous Agents [107.8237473711049]
大規模言語モデル(LLM)は、人間レベルの知性を達成する上で、顕著な可能性を示している。
本稿では,LLMに基づく自律エージェントの分野を総合的な観点から体系的に検討する。
本稿では、社会科学、自然科学、工学の分野におけるLLMベースの自律エージェントの多様な応用について概観する。
論文 参考訳(メタデータ) (2023-08-22T13:30:37Z) - A Comprehensive Overview of Large Language Models [70.78732351626734]
大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。
本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文 参考訳(メタデータ) (2023-07-12T20:01:52Z) - Multi-Agent Reinforcement Learning: Methods, Applications, Visionary
Prospects, and Challenges [4.496883842534544]
マルチエージェント強化学習(MARL)は、広く使われている人工知能(AI)技術である。
本研究の目的は,今後10年間の研究動向と展望を概説することである。
論文 参考訳(メタデータ) (2023-05-17T09:53:13Z) - MLOps Spanning Whole Machine Learning Life Cycle: A Survey [4.910132890978536]
Google AlphaGosの勝利は、機械学習(ML)の研究と開発を大いに動機付け、加速させた。
本稿では,既存のML技術の現状を包括的調査により明らかにすることを目的としている。
論文 参考訳(メタデータ) (2023-04-13T04:12:38Z) - Model-based Multi-agent Reinforcement Learning: Recent Progress and
Prospects [23.347535672670688]
マルチエージェント強化学習(MARL)は、複数の参加者が関与するシーケンシャルな意思決定問題に取り組む。
MARLは効果的なトレーニングのために膨大な数のサンプルを必要とする。
モデルに基づく手法は、サンプル効率の証明可能な利点を実現することが示されている。
論文 参考訳(メタデータ) (2022-03-20T17:24:47Z) - A Survey of Knowledge Tracing [49.79718735483553]
新型コロナウイルスの感染拡大は、オンライン教育の流行を引き起こしている。
オンライン学習プラットフォームを使用して、大量の学習データを記録および研究することが可能になった。
知識追跡(KT)は、学生の進化する知識状態を監視することを目的としている。
論文 参考訳(メタデータ) (2021-05-06T13:05:55Z) - Applications of deep learning in stock market prediction: recent
progress [5.780772209241294]
この調査は、株式市場予測のためのディープラーニングモデルに関する最近の研究の最新のレビューを提供する。
私たちは、異なるデータソース、さまざまなニューラルネットワーク構造、一般的なメトリクスを分類するだけでなく、実装と評価も分類します。
私たちのゴールは、興味のある研究者が最新の進歩と同期するのを助けると同時に、以前の研究をベースラインとして簡単に再現できるようにすることです。
論文 参考訳(メタデータ) (2020-02-29T03:37:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。