論文の概要: Large Language Models to the Rescue: Deadlock Resolution in Multi-Robot Systems
- arxiv url: http://arxiv.org/abs/2404.06413v1
- Date: Tue, 9 Apr 2024 16:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 14:01:33.836287
- Title: Large Language Models to the Rescue: Deadlock Resolution in Multi-Robot Systems
- Title(参考訳): 救助のための大規模言語モデル:マルチロボットシステムにおけるデッドロック分解能
- Authors: Kunal Garg, Jacob Arkin, Songyuan Zhang, Nicholas Roy, Chuchu Fan,
- Abstract要約: 本稿では,デッドロック解決のための大規模言語モデルの可能性について検討する。
本稿では,LLMがデッドロックを解決するための階層的な制御フレームワークを提案する。
グラフニューラルネットワークに基づく低レベル分散制御ポリシーは、割り当てられた計画を実行する。
- 参考スコア(独自算出の注目度): 19.519786983038202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent robotic systems are prone to deadlocks in an obstacle environment where the system can get stuck away from its desired location under a smooth low-level control policy. Without an external intervention, often in terms of a high-level command, it is not possible to guarantee that just a low-level control policy can resolve such deadlocks. Utilizing the generalizability and low data requirements of large language models (LLMs), this paper explores the possibility of using LLMs for deadlock resolution. We propose a hierarchical control framework where an LLM resolves deadlocks by assigning a leader and direction for the leader to move along. A graph neural network (GNN) based low-level distributed control policy executes the assigned plan. We systematically study various prompting techniques to improve LLM's performance in resolving deadlocks. In particular, as part of prompt engineering, we provide in-context examples for LLMs. We conducted extensive experiments on various multi-robot environments with up to 15 agents and 40 obstacles. Our results demonstrate that LLM-based high-level planners are effective in resolving deadlocks in MRS.
- Abstract(参考訳): マルチエージェントロボットシステムは、スムーズな低レベル制御ポリシーの下で、システムが所望の場所から遠ざかる障害環境でデッドロックする傾向がある。
外部からの介入がなければ、しばしばハイレベルなコマンドによって、低レベルなコントロールポリシーだけがこのようなデッドロックを解決できることを保証することはできない。
本稿では,大規模言語モデル(LLM)の一般化性と低データ要求を利用して,デッドロック分解能にLLMを用いることの可能性を検討する。
本稿では,LLMがデッドロックを解決するための階層的な制御フレームワークを提案する。
グラフニューラルネットワーク(GNN)に基づく低レベル分散制御ポリシーは、割り当てられた計画を実行する。
デッドロックの解消におけるLCMの性能向上のために,様々なプロンプト手法を体系的に検討した。
特に, プロンプトエンジニアリングの一環として, LLMのコンテキスト内例を提供する。
最大15個のエージェントと40個の障害物を持つ様々なマルチロボット環境について広範囲に実験を行った。
以上の結果から,LSMをベースとした高レベルプランナはMSSにおけるデッドロックの解消に有効であることが示された。
関連論文リスト
- Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。
しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。
人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-17T18:49:25Z) - Learning Efficient Flocking Control based on Gibbs Random Fields [8.715391538937707]
Gibbs Random Fields (GRF) を用いたマルチエージェント強化学習フレームワーク
アクションアテンションモジュールは、隣接するロボットの動作意図を暗黙的に予測するために導入される。
提案されたフレームワークは、成功率99%の挑戦的な環境で、マルチロボットシステムの効率的な分散制御ポリシーを学習することを可能にする。
論文 参考訳(メタデータ) (2025-02-05T08:27:58Z) - Solving Finite-Horizon MDPs via Low-Rank Tensors [9.072279909866845]
有限水平マルコフ決定過程(MDP)における最適政策の学習問題について検討する。
有限水平 MDP では、ポリシーと従って値関数 (VF) は定常ではない。
本稿では,有限ホライゾン MDP の VF を低ランクテンソルとしてモデル化することを提案する。
論文 参考訳(メタデータ) (2025-01-17T23:10:50Z) - MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文 参考訳(メタデータ) (2024-11-26T17:53:44Z) - Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。
TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文 参考訳(メタデータ) (2023-11-23T15:46:54Z) - Layered controller synthesis for dynamic multi-agent systems [0.0]
本稿では,多エージェント制御問題に対する階層的アプローチを3段階に分割する。
SWA-SMTソリューションは,ニューラルネットワーク制御ポリシ獲得を目的とした,最終段階の初期トレーニングデータセットとして使用しています。
論文 参考訳(メタデータ) (2023-07-13T13:56:27Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Modular Deep Reinforcement Learning for Continuous Motion Planning with
Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。
LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。
モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文 参考訳(メタデータ) (2021-02-24T01:11:25Z) - Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。
ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。
提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文 参考訳(メタデータ) (2020-07-20T17:12:34Z) - From proprioception to long-horizon planning in novel environments: A
hierarchical RL model [4.44317046648898]
本稿では,異なるタイプの推論を反映した,単純で3段階の階層型アーキテクチャを提案する。
本手法をMujoco Ant環境における一連のナビゲーションタスクに適用する。
論文 参考訳(メタデータ) (2020-06-11T17:19:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。