Fugu-MT 論文翻訳(概要): Large Language Models to the Rescue: Deadlock Resolution in Multi-Robot Systems

論文の概要: Large Language Models to the Rescue: Deadlock Resolution in Multi-Robot Systems

arxiv url: http://arxiv.org/abs/2404.06413v1
Date: Tue, 9 Apr 2024 16:03:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-10 14:01:33.836287
Title: Large Language Models to the Rescue: Deadlock Resolution in Multi-Robot Systems
Title（参考訳）: 救助のための大規模言語モデル:マルチロボットシステムにおけるデッドロック分解能
Authors: Kunal Garg, Jacob Arkin, Songyuan Zhang, Nicholas Roy, Chuchu Fan,
Abstract要約: 本稿では,デッドロック解決のための大規模言語モデルの可能性について検討する。本稿では,LLMがデッドロックを解決するための階層的な制御フレームワークを提案する。グラフニューラルネットワークに基づく低レベル分散制御ポリシーは、割り当てられた計画を実行する。
参考スコア（独自算出の注目度）: 19.519786983038202
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-agent robotic systems are prone to deadlocks in an obstacle environment where the system can get stuck away from its desired location under a smooth low-level control policy. Without an external intervention, often in terms of a high-level command, it is not possible to guarantee that just a low-level control policy can resolve such deadlocks. Utilizing the generalizability and low data requirements of large language models (LLMs), this paper explores the possibility of using LLMs for deadlock resolution. We propose a hierarchical control framework where an LLM resolves deadlocks by assigning a leader and direction for the leader to move along. A graph neural network (GNN) based low-level distributed control policy executes the assigned plan. We systematically study various prompting techniques to improve LLM's performance in resolving deadlocks. In particular, as part of prompt engineering, we provide in-context examples for LLMs. We conducted extensive experiments on various multi-robot environments with up to 15 agents and 40 obstacles. Our results demonstrate that LLM-based high-level planners are effective in resolving deadlocks in MRS.
Abstract（参考訳）: マルチエージェントロボットシステムは、スムーズな低レベル制御ポリシーの下で、システムが所望の場所から遠ざかる障害環境でデッドロックする傾向がある。外部からの介入がなければ、しばしばハイレベルなコマンドによって、低レベルなコントロールポリシーだけがこのようなデッドロックを解決できることを保証することはできない。本稿では,大規模言語モデル(LLM)の一般化性と低データ要求を利用して,デッドロック分解能にLLMを用いることの可能性を検討する。本稿では,LLMがデッドロックを解決するための階層的な制御フレームワークを提案する。グラフニューラルネットワーク(GNN)に基づく低レベル分散制御ポリシーは、割り当てられた計画を実行する。デッドロックの解消におけるLCMの性能向上のために,様々なプロンプト手法を体系的に検討した。特に, プロンプトエンジニアリングの一環として, LLMのコンテキスト内例を提供する。最大15個のエージェントと40個の障害物を持つ様々なマルチロボット環境について広範囲に実験を行った。以上の結果から,LSMをベースとした高レベルプランナはMSSにおけるデッドロックの解消に有効であることが示された。

関連論文リスト

Push Smarter, Not Harder: Hierarchical RL-Diffusion Policy for Efficient Nonprehensile Manipulation [8.7216199131049]
HeRDは階層的な強化学習拡散政策であり、プッシュタスクを高レベルの目標選択と低レベルの軌道生成という2つのレベルに分解する。我々は、中間空間目標を選択するための高レベル強化学習エージェントと、それに到達するための実用的で効率的な軌道を生成するための低レベル目標条件拡散モデルを用いる。この結果から,階層的制御を低レベル計画に組み込むことが,スケーラブルで目標指向の非包括的操作において有望な方向であることが示唆された。
論文参考訳（メタデータ） (2025-12-10T21:40:22Z)
Learning Decentralized Routing Policies via Graph Attention-based Multi-Agent Reinforcement Learning in Lunar Delay-Tolerant Networks [4.030873682988143]
我々は,Lunar Delay-Tolerant Network (LDTN) の制約下で動作するマルチロボット探査ミッションのための,完全に分散化されたルーティングフレームワークを提案する。本稿では、部分観測可能なマルコフ決定問題(POMDP)として問題を定式化し、強化訓練、分散実行(CTDE)を行うグラフ注意に基づくマルチエージェント強化学習(GAT-MARL)政策を提案する。本手法は局所的な観測のみに依存し,最短経路や制御されたフラッディングベースアルゴリズムのような古典的アプローチとは異なり,グローバルなトポロジ更新やパケット複製を必要としない。
論文参考訳（メタデータ） (2025-10-23T11:13:11Z)
Hierarchical Reinforcement Learning with Low-Level MPC for Multi-Agent Control [1.5856188608650232]
強化学習(RL)による戦術的意思決定とモデル予測制御(MPC)による低レベル実行を組み合わせた階層的枠組みを提案する。プレデター・プリーベンチマークでテストしたところ、我々のアプローチは報酬、安全性、一貫性の点でエンドツーエンドとシールドベースのRLベースラインよりも優れています。
論文参考訳（メタデータ） (2025-09-19T09:27:15Z)
Benchmarking LLMs' Swarm intelligence [50.544186914115045]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文参考訳（メタデータ） (2025-05-07T12:32:01Z)
Embodied Long Horizon Manipulation with Closed-loop Code Generation and Incremental Few-shot Adaptation [12.077740860502878]
身体的ロングホライゾン操作では、ロボットシステムが視覚や自然言語などのマルチモーダル入力を処理し、それらを実行可能なアクションに変換する必要がある。近年,大規模言語モデル (LLM) を自然言語を用いてタスクをサブタスクに分解し,事前訓練した低レベルコントローラを誘導する高レベルプランナとしての利用が検討されている。我々のフレームワークは,LoHoRavens,CALVIN,Franka Kitchen,および乱雑な現実世界設定をまたいだ,30以上の多様かつ不明瞭なロングホライゾンタスクに対して,最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (2025-03-27T20:32:58Z)
EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments [11.97783742296183]
Embodied Mobile Manipulation in Open Environmentsは、エージェントがユーザーの指示を解釈し、連続した空間で長時間の日常的なタスクを実行する必要があるベンチマークである。 Open EnvironmentsにおけるEmbodied Mobile Manipulationは、より多様な評価のための3つの新しいメトリクスとともに、ハイレベルで低レベルな実施タスクを統一されたフレームワークにシームレスに統合します。 We design model, a sophisticated agent system, a LLM with Direct Preference Optimization (DPO), light weighted navigation and operation model, and multiple error detection mechanism。
論文参考訳（メタデータ） (2025-03-11T16:42:36Z)
Scaling Autonomous Agents via Automatic Reward Modeling And Planning [52.39395405893965]
大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な機能を示している。しかし、彼らは多段階の意思決定と環境フィードバックを必要とする問題に苦戦している。人間のアノテーションを使わずに環境から報酬モデルを自動的に学習できるフレームワークを提案する。
論文参考訳（メタデータ） (2025-02-17T18:49:25Z)
Learning Efficient Flocking Control based on Gibbs Random Fields [8.715391538937707]
Gibbs Random Fields (GRF) を用いたマルチエージェント強化学習フレームワークアクションアテンションモジュールは、隣接するロボットの動作意図を暗黙的に予測するために導入される。提案されたフレームワークは、成功率99%の挑戦的な環境で、マルチロボットシステムの効率的な分散制御ポリシーを学習することを可能にする。
論文参考訳（メタデータ） (2025-02-05T08:27:58Z)
Solving Finite-Horizon MDPs via Low-Rank Tensors [9.072279909866845]
有限水平マルコフ決定過程(MDP)における最適政策の学習問題について検討する。有限水平 MDP では、ポリシーと従って値関数 (VF) は定常ではない。本稿では,有限ホライゾン MDP の VF を低ランクテンソルとしてモデル化することを提案する。
論文参考訳（メタデータ） (2025-01-17T23:10:50Z)
MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [52.739500459903724]
大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文参考訳（メタデータ） (2024-11-26T17:53:44Z)
ET-Plan-Bench: Embodied Task-level Planning Benchmark Towards Spatial-Temporal Cognition with Foundation Models [39.606908488885125]
ET-Plan-Benchは、Large Language Models (LLMs) を用いたタスク計画の具体化のためのベンチマークである。様々な難易度や複雑さのレベルにおいて、制御可能で多様な実施タスクが特徴である。我々のベンチマークでは、大規模で定量化され、高度に自動化され、きめ細かな診断フレームワークとして認識されている。
論文参考訳（メタデータ） (2024-10-02T19:56:38Z)
Task-Distributionally Robust Data-Free Meta-Learning [99.56612787882334]
Data-Free Meta-Learning (DFML)は、複数の事前学習モデルを活用することで、独自のトレーニングデータを必要とせずに、新しいタスクを効率的に学習することを目的としている。 TDS(Task-Distribution Shift)とTDC(Task-Distribution Corruption)の2つの大きな課題を初めて明らかにした。
論文参考訳（メタデータ） (2023-11-23T15:46:54Z)
SALMON: Self-Alignment with Instructable Reward Models [80.83323636730341]
本稿では,基本言語モデルと人間の監督を最小限に整合させる新しいアプローチ,すなわちSALMONを提案する。私たちはDromedary-2という名のAIアシスタントを開発しており、コンテキスト内学習には6つの例と31の人間定義原則しかありません。
論文参考訳（メタデータ） (2023-10-09T17:56:53Z)
Layered controller synthesis for dynamic multi-agent systems [0.0]
本稿では,多エージェント制御問題に対する階層的アプローチを3段階に分割する。 SWA-SMTソリューションは,ニューラルネットワーク制御ポリシ獲得を目的とした,最終段階の初期トレーニングデータセットとして使用しています。
論文参考訳（メタデータ） (2023-07-13T13:56:27Z)
Fully Decentralized Model-based Policy Optimization for Networked Systems [23.46407780093797]
本研究の目的は,モデルベース学習によるマルチエージェント制御のデータ効率の向上である。エージェントが協力的であり、隣人とのみローカルに通信するネットワークシステムについて検討する。提案手法では,各エージェントが将来の状態を予測し,通信によって予測をブロードキャストする動的モデルを学習し,その後,モデルロールアウトに基づいてポリシーをトレーニングする。
論文参考訳（メタデータ） (2022-07-13T23:52:14Z)
Evaluating model-based planning and planner amortization for continuous control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文参考訳（メタデータ） (2021-10-07T12:00:40Z)
Modular Deep Reinforcement Learning for Continuous Motion Planning with Temporal Logic [59.94347858883343]
本稿では,マルコフ決定過程(MDP)をモデルとした自律動的システムの運動計画について検討する。 LDGBA と MDP の間に組込み製品 MDP (EP-MDP) を設計することである。モデルフリー強化学習(RL)のためのLDGBAベースの報酬形成と割引スキームは、EP-MDP状態にのみ依存する。
論文参考訳（メタデータ） (2021-02-24T01:11:25Z)
Learning High-Level Policies for Model Predictive Control [54.00297896763184]
Model Predictive Control (MPC)は、ロボット制御タスクに対する堅牢なソリューションを提供する。ニューラルネットワークの高レベルポリシーを学習するための自己教師付き学習アルゴリズムを提案する。提案手法は, 標準的なMPCでは困難な状況に対処できることを示す。
論文参考訳（メタデータ） (2020-07-20T17:12:34Z)
From proprioception to long-horizon planning in novel environments: A hierarchical RL model [4.44317046648898]
本稿では,異なるタイプの推論を反映した,単純で3段階の階層型アーキテクチャを提案する。本手法をMujoco Ant環境における一連のナビゲーションタスクに適用する。
論文参考訳（メタデータ） (2020-06-11T17:19:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。