論文の概要: Causal Multi-Agent Reinforcement Learning: Review and Open Problems
- arxiv url: http://arxiv.org/abs/2111.06721v1
- Date: Fri, 12 Nov 2021 13:44:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 13:24:24.436921
- Title: Causal Multi-Agent Reinforcement Learning: Review and Open Problems
- Title(参考訳): Causal Multi-Agent Reinforcement Learning: レビューとオープン問題
- Authors: St John Grimbly, Jonathan Shock, Arnu Pretorius
- Abstract要約: 本稿では,マルチエージェント強化学習(MARL)の分野に読者を紹介する。
我々は、MARLにおける重要な課題を強調し、これらを因果的手法がそれらに取り組む上でどのように役立つかという文脈で論じる。
- 参考スコア(独自算出の注目度): 5.0519220616720295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper serves to introduce the reader to the field of multi-agent
reinforcement learning (MARL) and its intersection with methods from the study
of causality. We highlight key challenges in MARL and discuss these in the
context of how causal methods may assist in tackling them. We promote moving
toward a 'causality first' perspective on MARL. Specifically, we argue that
causality can offer improved safety, interpretability, and robustness, while
also providing strong theoretical guarantees for emergent behaviour. We discuss
potential solutions for common challenges, and use this context to motivate
future research directions.
- Abstract(参考訳): 本稿では,マルチエージェント強化学習(MARL)の分野とその因果性研究の手法との共通点について紹介する。
marlの重要な課題を強調し、因果メソッドがそれらに取り組むのにどのように役立つかという文脈で議論する。
MARLの「因果的第一」視点への移動を促進する。
具体的には、因果性は安全性、解釈可能性、堅牢性を向上し、同時に創発的行動に対する強力な理論的保証を提供する。
我々は、共通の課題に対する潜在的な解決策について議論し、この文脈を用いて将来の研究方向性を動機づける。
関連論文リスト
- Knowledge Conflicts for LLMs: A Survey [20.491697505325636]
調査では、コンテキストメモリ、コンテキスト間、メモリ内コンフリクトの3つのカテゴリに焦点が当てられている。
これらの対立は、大規模言語モデルの信頼性と性能に大きな影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2024-03-13T08:02:23Z) - K-Level Reasoning with Large Language Models [80.13817747270029]
急速に発展する環境における意思決定のための大規模言語モデル(LLM)の動的推論機能について検討する。
実世界の動的意思決定の複雑さを反映した2つのゲーム理論に基づくパイロットチャレンジを導入する。
これらの課題は明確に定義されており、LLMの動的推論能力の明確で制御可能で正確な評価を可能にする。
論文 参考訳(メタデータ) (2024-02-02T16:07:05Z) - Sim-to-Real Causal Transfer: A Metric Learning Approach to
Causally-Aware Interaction Representations [62.48505112245388]
エージェント相互作用の現代的表現の因果認識を詳細に検討する。
近年の表現は、非因果剤の摂動に対して部分的に耐性があることが示されている。
因果アノテーションを用いた潜在表現を正規化するための計量学習手法を提案する。
論文 参考訳(メタデータ) (2023-12-07T18:57:03Z) - A Survey on Interpretable Cross-modal Reasoning [64.37362731950843]
マルチメディア分析から医療診断に至るまで、クロスモーダル推論(CMR)が重要な分野として浮上している。
この調査は、解釈可能なクロスモーダル推論(I-CMR)の領域を掘り下げる
本調査では,I-CMRの3段階分類法について概説する。
論文 参考訳(メタデータ) (2023-09-05T05:06:48Z) - Towards CausalGPT: A Multi-Agent Approach for Faithful Knowledge
Reasoning via Promoting Causal Consistency in LLMs [63.26541167737355]
知識に基づく推論における忠実さと因果性を高めるための枠組みを提案する。
我々のフレームワークは、最先端のアプローチを大きなマージンで比較している。
論文 参考訳(メタデータ) (2023-08-23T04:59:21Z) - Causal Reinforcement Learning: A Survey [57.368108154871]
強化学習は、不確実性の下でのシーケンシャルな決定問題の解決に不可欠なパラダイムである。
主な障害の1つは、強化学習エージェントが世界に対する根本的な理解を欠いていることである。
因果性は、体系的な方法で知識を形式化できるという点で顕著な利点がある。
論文 参考訳(メタデータ) (2023-07-04T03:00:43Z) - Multi-Agent Reinforcement Learning: Methods, Applications, Visionary
Prospects, and Challenges [4.496883842534544]
マルチエージェント強化学習(MARL)は、広く使われている人工知能(AI)技術である。
本研究の目的は,今後10年間の研究動向と展望を概説することである。
論文 参考訳(メタデータ) (2023-05-17T09:53:13Z) - A Survey on Interpretable Reinforcement Learning [28.869513255570077]
本調査は、強化学習(RL)における高い解釈可能性を実現するための様々なアプローチの概要を提供する。
我々は、解釈可能性(モデルの特性として)と説明可能性(プロキシの介入によるポストホック操作として)を区別する。
我々は、解釈可能なRLは、解釈可能な入力、解釈可能な(遷移/回帰)モデル、解釈可能な意思決定など、異なる側面を受け入れることができると主張している。
論文 参考訳(メタデータ) (2021-12-24T17:26:57Z) - Decentralized Multi-Agent Reinforcement Learning for Task Offloading
Under Uncertainty [24.083871784808473]
MARL(Multi-Agent Reinforcement Learning)は、強化学習の課題である。
タスクオフロード問題を解くために、ディープMARLアルゴリズムが適用されている。
報奨信号の摂動は, 完全報奨学習と比較して, 性能の低下を招き得ることを示す。
論文 参考訳(メタデータ) (2021-07-16T20:49:30Z) - Towards Causal Representation Learning [96.110881654479]
機械学習とグラフィカル因果関係の2つの分野が生まれ、別々に発展した。
現在、他分野の進歩の恩恵を受けるために、クロスポリン化と両方の分野への関心が高まっている。
論文 参考訳(メタデータ) (2021-02-22T15:26:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。