論文の概要: Causal Multi-Agent Reinforcement Learning: Review and Open Problems
- arxiv url: http://arxiv.org/abs/2111.06721v1
- Date: Fri, 12 Nov 2021 13:44:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 13:24:24.436921
- Title: Causal Multi-Agent Reinforcement Learning: Review and Open Problems
- Title(参考訳): Causal Multi-Agent Reinforcement Learning: レビューとオープン問題
- Authors: St John Grimbly, Jonathan Shock, Arnu Pretorius
- Abstract要約: 本稿では,マルチエージェント強化学習(MARL)の分野に読者を紹介する。
我々は、MARLにおける重要な課題を強調し、これらを因果的手法がそれらに取り組む上でどのように役立つかという文脈で論じる。
- 参考スコア(独自算出の注目度): 5.0519220616720295
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper serves to introduce the reader to the field of multi-agent
reinforcement learning (MARL) and its intersection with methods from the study
of causality. We highlight key challenges in MARL and discuss these in the
context of how causal methods may assist in tackling them. We promote moving
toward a 'causality first' perspective on MARL. Specifically, we argue that
causality can offer improved safety, interpretability, and robustness, while
also providing strong theoretical guarantees for emergent behaviour. We discuss
potential solutions for common challenges, and use this context to motivate
future research directions.
- Abstract(参考訳): 本稿では,マルチエージェント強化学習(MARL)の分野とその因果性研究の手法との共通点について紹介する。
marlの重要な課題を強調し、因果メソッドがそれらに取り組むのにどのように役立つかという文脈で議論する。
MARLの「因果的第一」視点への移動を促進する。
具体的には、因果性は安全性、解釈可能性、堅牢性を向上し、同時に創発的行動に対する強力な理論的保証を提供する。
我々は、共通の課題に対する潜在的な解決策について議論し、この文脈を用いて将来の研究方向性を動機づける。
関連論文リスト
- Improving Causal Reasoning in Large Language Models: A Survey [16.55801836321059]
因果推論は知性の重要な側面であり、問題解決、意思決定、世界理解に不可欠である。
大規模言語モデル(LLM)は出力に対して有理性を生成することができるが、因果推論を確実に行う能力は未だ不明である。
論文 参考訳(メタデータ) (2024-10-22T04:18:19Z) - Insight Over Sight? Exploring the Vision-Knowledge Conflicts in Multimodal LLMs [55.74117540987519]
本稿では,マルチモーダル大言語モデル(MLLM)におけるコモンセンスレベルの視覚知識衝突の問題について考察する。
MLLMのコンフリクトのシミュレーションと評価を目的としたベンチマークを確立するため,人間のループ品質制御を付加した自動パイプラインを導入する。
各種モデルファミリーにおける9つの代表MLLMのコンフリクト分解能を評価し,テキストクエリに顕著なオーバー信頼度を求める。
論文 参考訳(メタデータ) (2024-10-10T17:31:17Z) - The Odyssey of Commonsense Causality: From Foundational Benchmarks to Cutting-Edge Reasoning [70.16523526957162]
常識の因果関係を理解することは、人々が現実世界の原理をよりよく理解するのに役立ちます。
その重要性にもかかわらず、このトピックの体系的な探索は特に欠落している。
本研究の目的は、体系的な概要の提供、最近の進歩に関する学者の更新、初心者のための実践的なガイドを提供することである。
論文 参考訳(メタデータ) (2024-06-27T16:30:50Z) - Robustness Assessment of Mathematical Reasoning in the Presence of Missing and Contradictory Conditions [48.251724997889184]
我々は、ミス・コントラクタリー条件(PMC)に関する問題というベンチマークを開発する。
本稿では,これらのシナリオにおける数ショットプロンプト手法の性能を評価するための2つの新しい指標を提案する。
SMT-LIB Prompting (SLP) と呼ばれる,SMT-LIB言語を用いて直接解決する代わりに,この問題をモデル化する手法を提案する。
論文 参考訳(メタデータ) (2024-06-07T16:24:12Z) - LLM as a Mastermind: A Survey of Strategic Reasoning with Large Language Models [75.89014602596673]
戦略推論は、戦略を調整しながら、マルチエージェント設定における敵の行動を理解し、予測する必要がある。
大規模言語モデルを用いた戦略的推論に関連するスコープ,アプリケーション,方法論,評価指標について検討する。
戦略的推論を重要な認知能力として重要視し、将来の研究の方向性や潜在的な改善に関する洞察を提供する。
論文 参考訳(メタデータ) (2024-04-01T16:50:54Z) - Knowledge Conflicts for LLMs: A Survey [24.731074825915833]
調査では、コンテキストメモリ、コンテキスト間、メモリ内コンフリクトの3つのカテゴリに焦点が当てられている。
これらの対立は、大規模言語モデルの信頼性と性能に大きな影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2024-03-13T08:02:23Z) - Multi-agent Reinforcement Learning: A Comprehensive Survey [10.186029242664931]
マルチエージェントシステム(MAS)は、多くの現実世界のアプリケーションにおいて広く普及し、重要な存在である。
汎用性にもかかわらず、MASにおける知的意思決定エージェントの開発は、その効果的な実装にいくつかのオープンな課題を提起している。
本調査は,ゲーム理論(GT)と機械学習(ML)による基礎概念の研究に重点を置いて,これらの課題を考察する。
論文 参考訳(メタデータ) (2023-12-15T23:16:54Z) - Towards CausalGPT: A Multi-Agent Approach for Faithful Knowledge Reasoning via Promoting Causal Consistency in LLMs [60.244412212130264]
Causal-Consistency Chain-of-Thoughtは、基礎モデルの忠実さと因果性を強化するために、マルチエージェントコラボレーションを活用する。
我々のフレームワークは、広範囲かつ包括的な評価を通じて、最先端の手法よりも大きな優位性を示す。
論文 参考訳(メタデータ) (2023-08-23T04:59:21Z) - Causal Reinforcement Learning: A Survey [57.368108154871]
強化学習は、不確実性の下でのシーケンシャルな決定問題の解決に不可欠なパラダイムである。
主な障害の1つは、強化学習エージェントが世界に対する根本的な理解を欠いていることである。
因果性は、体系的な方法で知識を形式化できるという点で顕著な利点がある。
論文 参考訳(メタデータ) (2023-07-04T03:00:43Z) - Multi-Agent Reinforcement Learning: Methods, Applications, Visionary
Prospects, and Challenges [4.496883842534544]
マルチエージェント強化学習(MARL)は、広く使われている人工知能(AI)技術である。
本研究の目的は,今後10年間の研究動向と展望を概説することである。
論文 参考訳(メタデータ) (2023-05-17T09:53:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。