Fugu-MT 論文翻訳(概要): An Overview of Multi-Agent Reinforcement Learning from Game Theoretical Perspective

論文の概要: An Overview of Multi-Agent Reinforcement Learning from Game Theoretical Perspective

arxiv url: http://arxiv.org/abs/2011.00583v3
Date: Thu, 18 Mar 2021 01:43:32 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-30 23:48:40.032477
Title: An Overview of Multi-Agent Reinforcement Learning from Game Theoretical Perspective
Title（参考訳）: ゲーム理論から見たマルチエージェント強化学習の概観
Authors: Yaodong Yang, Jun Wang
Abstract要約: この研究は、ゲーム理論の観点から、現在の最先端のMARL技術について自己完結した評価を提供する。 MARLは複数のエージェントが同時に学習するマルチエージェントシステムにおける学習問題に対応する。
参考スコア（独自算出の注目度）: 12.185870309965011
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Following the remarkable success of the AlphaGO series, 2019 was a booming year that witnessed significant advances in multi-agent reinforcement learning (MARL) techniques. MARL corresponds to the learning problem in a multi-agent system in which multiple agents learn simultaneously. It is an interdisciplinary domain with a long history that includes game theory, machine learning, stochastic control, psychology, and optimisation. Although MARL has achieved considerable empirical success in solving real-world games, there is a lack of a self-contained overview in the literature that elaborates the game theoretical foundations of modern MARL methods and summarises the recent advances. In fact, the majority of existing surveys are outdated and do not fully cover the recent developments since 2010. In this work, we provide a monograph on MARL that covers both the fundamentals and the latest developments in the research frontier. The goal of our monograph is to provide a self-contained assessment of the current state-of-the-art MARL techniques from a game theoretical perspective. We expect this work to serve as a stepping stone for both new researchers who are about to enter this fast-growing domain and existing domain experts who want to obtain a panoramic view and identify new directions based on recent advances.
Abstract（参考訳）: alphagoシリーズの成功に続いて、2019年はマルチエージェント強化学習(marl)技術が大幅に進歩した年となった。 MARLは複数のエージェントが同時に学習するマルチエージェントシステムにおける学習問題に対応する。ゲーム理論、機械学習、確率制御、心理学、最適化を含む長い歴史を持つ学際ドメインである。 MARLは現実世界のゲームを解く上で経験的な成功を収めてきたが、現代のMARL手法のゲーム理論の基礎を詳述し、最近の進歩を要約する自己完結した概要は文献に欠けている。実際、既存の調査の大部分は時代遅れであり、2010年以降の最近の開発を完全にカバーしていない。本稿では,研究フロンティアにおける基礎と最新の発展の両方を網羅した,MARLに関するモノグラフを提供する。本研究の目的は,ゲーム理論の観点から,現在最先端のMARL技術の自己完結型評価を提供することである。この研究は、この急速に成長する領域に参入しようとしている新しい研究者と、パノラマ図を取得して、最近の進歩に基づいて新しい方向を特定したい既存ドメインの専門家の両方にとって、足場となるものと期待している。

関連論文リスト

MARFT: Multi-Agent Reinforcement Fine-Tuning [26.527065316690123]
本稿では,MARFT(Multi-Agent Reinforcement Fine-Tuning)の総合的研究について述べる。 MARFTはマルチエージェント強化ファインチューニング(LaMAS)と呼ばれるパラダイムである我々は,LaMASに適した普遍的アルゴリズムフレームワークを導入し,概念的基礎,重要な特徴,実践的実装戦略について概説する。
論文参考訳（メタデータ） (2025-04-21T07:03:54Z)
O1 Replication Journey: A Strategic Progress Report -- Part 1 [52.062216849476776]
本稿では,O1 Replication Journeyに具体化された人工知能研究の先駆的アプローチを紹介する。我々の方法論は、長期化したチームベースのプロジェクトの不規則性を含む、現代のAI研究における重要な課題に対処する。本稿では,モデルにショートカットだけでなく,完全な探索プロセスの学習を促す旅行学習パラダイムを提案する。
論文参考訳（メタデータ） (2024-10-08T15:13:01Z)
From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9134620424985]
クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。 CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文参考訳（メタデータ） (2024-09-19T02:51:54Z)
Classical Machine Learning: Seventy Years of Algorithmic Learning Evolution [1.121816400852218]
機械学習(ML)は多くの分野を変えてきたが、その基礎研究を理解することは、その継続的な進歩に不可欠である。本稿では,古典的MLアルゴリズムの概要を概説し,12年間にわたる最先端の出版物について考察する。我々は、著名なMLカンファレンスやジャーナルから引用された論文のデータセットを分析し、引用とキーワード分析を用いて批判的な洞察を明らかにした。
論文参考訳（メタデータ） (2024-08-03T11:07:10Z)
ChatGPT Alternative Solutions: Large Language Models Survey [0.0]
大規模言語モデル(LLM)はこの領域における研究貢献の急増に火をつけた。近年、学術と産業のダイナミックな相乗効果が見られ、LLM研究の分野を新たな高地へと押し上げた。この調査は、ジェネレーティブAIの現状をよく理解し、さらなる探索、強化、イノベーションの機会に光を当てている。
論文参考訳（メタデータ） (2024-03-21T15:16:50Z)
A Survey on Game Playing Agents and Large Models: Methods, Applications, and Challenges [29.74898680986507]
複雑なゲームプレイシナリオにおけるLM使用状況と課題を概観する。我々は,ゲームにおけるLMの進歩に向けた将来的な研究の道のりについて,今後の展望を述べる。
論文参考訳（メタデータ） (2024-03-15T12:37:12Z)
Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [52.24001776263608]
この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文参考訳（メタデータ） (2024-01-30T03:51:44Z)
Large Language Models for Generative Information Extraction: A Survey [89.71273968283616]
大規模言語モデル(LLM)は、テキスト理解と生成において顕著な能力を示した。各種IEサブタスクと技術の観点から,これらの作品を分類して概観する。我々は,最も先進的な手法を実証的に分析し,LLMによるIEタスクの出現傾向を明らかにする。
論文参考訳（メタデータ） (2023-12-29T14:25:22Z)
Multi-agent Reinforcement Learning: A Comprehensive Survey [10.186029242664931]
マルチエージェントシステム(MAS)は、多くの現実世界のアプリケーションにおいて広く普及し、重要な存在である。汎用性にもかかわらず、MASにおける知的意思決定エージェントの開発は、その効果的な実装にいくつかのオープンな課題を提起している。本調査は,ゲーム理論(GT)と機械学習(ML)による基礎概念の研究に重点を置いて,これらの課題を考察する。
論文参考訳（メタデータ） (2023-12-15T23:16:54Z)
Federated Learning for Generalization, Robustness, Fairness: A Survey and Benchmark [55.898771405172155]
フェデレートラーニングは、異なる当事者間のプライバシー保護コラボレーションのための有望なパラダイムとして登場した。我々は,連合学習研究の重要かつ最近の展開を体系的に概観する。
論文参考訳（メタデータ） (2023-11-12T06:32:30Z)
A Comprehensive Overview of Large Language Models [68.22178313875618]
大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文参考訳（メタデータ） (2023-07-12T20:01:52Z)
A Survey on Multimodal Large Language Models [71.63375558033364]
GPT-4Vで表されるマルチモーダル大言語モデル(MLLM)は、新たな研究ホットスポットとなっている。本稿では,MLLMの最近の進歩を追跡・要約することを目的とする。
論文参考訳（メタデータ） (2023-06-23T15:21:52Z)
Multi-Agent Reinforcement Learning: Methods, Applications, Visionary Prospects, and Challenges [4.496883842534544]
マルチエージェント強化学習(MARL)は、広く使われている人工知能(AI)技術である。本研究の目的は,今後10年間の研究動向と展望を概説することである。
論文参考訳（メタデータ） (2023-05-17T09:53:13Z)
MLOps Spanning Whole Machine Learning Life Cycle: A Survey [4.910132890978536]
Google AlphaGosの勝利は、機械学習(ML)の研究と開発を大いに動機付け、加速させた。本稿では,既存のML技術の現状を包括的調査により明らかにすることを目的としている。
論文参考訳（メタデータ） (2023-04-13T04:12:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。