論文の概要: Towards Using Promises for Multi-Agent Cooperation in Goal Reasoning
- arxiv url: http://arxiv.org/abs/2206.09864v1
- Date: Mon, 20 Jun 2022 15:57:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-23 13:06:27.690397
- Title: Towards Using Promises for Multi-Agent Cooperation in Goal Reasoning
- Title(参考訳): ゴール推論におけるマルチエージェント協調のためのpromise活用に向けて
- Authors: Daniel Swoboda, Till Hofmann, Tarik Viehmann, Gerhard Lakemeyer
- Abstract要約: 一般的に使われているゴール改善メカニズムであるゴールライフサイクルに、約束をどのように組み込むことができるかを示す。
次に、時間付き初期リテラルに接続することで、特定の目標を計画する際にPromiseをどのように使用できるかを示す。
- 参考スコア(独自算出の注目度): 15.924281804465254
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Reasoning and planning for mobile robots is a challenging problem, as the
world evolves over time and thus the robot's goals may change. One technique to
tackle this problem is goal reasoning, where the agent not only reasons about
its actions, but also about which goals to pursue. While goal reasoning for
single agents has been researched extensively, distributed, multi-agent goal
reasoning comes with additional challenges, especially in a distributed
setting. In such a context, some form of coordination is necessary to allow for
cooperative behavior. Previous goal reasoning approaches share the agent's
world model with the other agents, which already enables basic cooperation.
However, the agent's goals, and thus its intentions, are typically not shared.
In this paper, we present a method to tackle this limitation. Extending an
existing goal reasoning framework, we propose enabling cooperative behavior
between multiple agents through promises, where an agent may promise that
certain facts will be true at some point in the future. Sharing these promises
allows other agents to not only consider the current state of the world, but
also the intentions of other agents when deciding on which goal to pursue next.
We describe how promises can be incorporated into the goal life cycle, a
commonly used goal refinement mechanism. We then show how promises can be used
when planning for a particular goal by connecting them to timed initial
literals (TILs) from PDDL planning. Finally, we evaluate our prototypical
implementation in a simplified logistics scenario.
- Abstract(参考訳): 移動ロボットの推論と計画は、世界が時間とともに進化し、ロボットの目標が変わるため、難しい問題である。
この問題に対処する1つのテクニックは、エージェントが行動の理由だけでなく、どの目標を追求するかという目標推論である。
単一エージェントのゴール推論は広く研究されているが、分散されたマルチエージェントのゴール推論には、特に分散環境での課題が伴う。
このような文脈では、協調行動を可能にする何らかの形態の協調が必要である。
以前の目標推論アプローチでは、エージェントの世界モデルを他のエージェントと共有している。
しかし、エージェントの目標とその意図は一般に共有されない。
本稿では,この制限に対処する手法を提案する。
既存の目標推論フレームワークを拡張し、エージェントが将来ある時点で事実が真実であることを約束する約束を通じて、複数のエージェント間の協調行動を可能にすることを提案する。
これらの約束を共有することで、他のエージェントは世界の現在の状況だけでなく、次の目標を決定する際の他のエージェントの意図も考慮することができる。
一般的に使用されるゴール改善メカニズムであるゴールライフサイクルに、約束をどのように組み込むかを説明する。
次に、PDDL計画からタイムドイニシャルリテラル(TIL)に接続することで、特定の目標を計画する際に、約束がどのように使用できるかを示す。
最後に, 簡易なロジスティクスシナリオにおけるプロトタイプ実装の評価を行った。
関連論文リスト
- The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z) - Adaptation and Communication in Human-Robot Teaming to Handle
Discrepancies in Agents' Beliefs about Plans [13.637799815698559]
我々はモンテカルロ木探索に基づくオンライン実行アルゴリズムを提案し,その動作を計画する。
私たちのエージェントは、共有されたメンタルモデルを保証することなく、チームで作業するための装備がより優れていることを示しています。
論文 参考訳(メタデータ) (2023-07-07T03:05:34Z) - Inferring the Goals of Communicating Agents from Actions and
Instructions [47.5816320484482]
本稿では,あるエージェント,プリンシパルが,その共有計画に関する自然言語指示を他のエージェント,アシスタントに伝達できるような協力チームのモデルを提案する。
3人目のオブザーバが、アクションや指示からマルチモーダルな逆計画を通じて、チームの目標を推測する方法を示します。
我々は,マルチエージェントグリッドワールドにおける人間の目標推定と比較し,モデルの推定が人間の判断と密接に相関していることを見出した。
論文 参考訳(メタデータ) (2023-06-28T13:43:46Z) - A Fully Controllable Agent in the Path Planning using Goal-Conditioned
Reinforcement Learning [0.0]
経路計画において、経路は、エージェントが様々な目標に達することが重要であるなど、変数の数によって異なる場合がある。
経路計画における完全制御可能なエージェントのための新しい強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-20T05:18:03Z) - Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - Bisimulation Makes Analogies in Goal-Conditioned Reinforcement Learning [71.52722621691365]
リッチな観測から汎用的な目標条件エージェントを構築することは、実世界の問題を解決するための強化学習(RL)の鍵となる。
目的条件ビシミュレーションと呼ばれる新しい状態抽象化法を提案する。
この抽象概念の計量形式を用いてこの表現を学習し、シミュレーション操作タスクにおける新しい目標に一般化する能力を示す。
論文 参考訳(メタデータ) (2022-04-27T17:00:11Z) - Efficient Multi-agent Epistemic Planning: Teaching Planners About Nested
Belief [27.524600740450126]
我々は, 一つのエージェントの観点から, ネストされた信念, 非同質なエージェント, 共同表現観察, あるいはあるエージェントが別のエージェントであるかのように推論する能力を含む, 目標と行動の可能性を秘めている。
提案手法は,複数エージェントのネストされた信念を含む計画課題に,十分に確立された自動計画分野を適用するための重要なステップである。
論文 参考訳(メタデータ) (2021-10-06T03:24:01Z) - Modelling Multi-Agent Epistemic Planning in ASP [66.76082318001976]
本稿では,マルチショット・アンサー・セット・プログラミング・ベース・プランナの実装について述べる。
本稿は, アドホックなエピステミック状態表現とASPソルバの効率を生かしたプランナーが, 文献から収集したベンチマークに対して, 競合的な性能を示すことを示す。
論文 参考訳(メタデータ) (2020-08-07T06:35:56Z) - Automatic Curriculum Learning through Value Disagreement [95.19299356298876]
新しい未解決タスクを継続的に解決することが、多様な行動を学ぶための鍵です。
エージェントが複数の目標を達成する必要があるマルチタスク領域では、トレーニング目標の選択はサンプル効率に大きな影響を与える可能性がある。
そこで我々は,エージェントが解決すべき目標のための自動カリキュラムを作成することを提案する。
提案手法は,13のマルチゴールロボットタスクと5つのナビゲーションタスクにまたがって評価し,現在の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2020-06-17T03:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。