論文の概要: From Dialogue to Execution: Mixture-of-Agents Assisted Interactive Planning for Behavior Tree-Based Long-Horizon Robot Execution
- arxiv url: http://arxiv.org/abs/2603.01113v1
- Date: Sun, 01 Mar 2026 13:54:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.798482
- Title: From Dialogue to Execution: Mixture-of-Agents Assisted Interactive Planning for Behavior Tree-Based Long-Horizon Robot Execution
- Title(参考訳): 対話から実行へ:行動木に基づく長距離ロボット実行のための対話型計画支援エージェント
- Authors: Kanata Suzuki, Kazuki Hori, Haruka Miyoshi, Shuhei Kurita, Tetsuya Ogata,
- Abstract要約: 大型言語モデル(LLM)により、ロボットは自然言語命令からハイレベルなアクションプランを生成することができる。
長期的タスクでは、このようなアプローチには多くの疑問が伴い、ユーザの負担が増大する。
そこで我々は,Mixture-of-Agents(MoA)ベースのプロキシ応答を対話型プランニングに統合するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 10.513251543236684
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive task planning with large language models (LLMs) enables robots to generate high-level action plans from natural language instructions. However, in long-horizon tasks, such approaches often require many questions, increasing user burden. Moreover, flat plan representations become difficult to manage as task complexity grows. We propose a framework that integrates Mixture-of-Agents (MoA)-based proxy answering into interactive planning and generates Behavior Trees (BTs) for structured long-term execution. The MoA consists of multiple LLM-based expert agents that answer general or domain-specific questions when possible, reducing unnecessary human intervention. The resulting BT hierarchically represents task logic and enables retry mechanisms and dynamic switching among multiple robot policies. Experiments on cocktail-making tasks show that the proposed method reduces human response requirements by approximately 27% while maintaining structural and semantic similarity to fully human-answered BTs. Real-robot experiments on a smoothie-making task further demonstrate successful long-horizon execution with adaptive policy switching and recovery from action failures. These results indicate that MoA-assisted interactive planning improves dialogue efficiency while preserving execution quality in real-world robotic tasks.
- Abstract(参考訳): 大規模言語モデル(LLM)を用いた対話型タスクプランニングにより、ロボットは自然言語命令からハイレベルなアクションプランを生成することができる。
しかし、長期的タスクでは、このようなアプローチには多くの疑問が伴い、ユーザの負担が増大する。
さらに,タスクの複雑さが増大するにつれて,平面計画表現の管理が困難になる。
本研究では,Mixture-of-Agents(MoA)ベースのプロキシ応答を対話型プランニングに統合し,長期実行のための動作木(BT)を生成するフレームワークを提案する。
MoAは複数のLSMベースの専門家エージェントで構成されており、一般またはドメイン固有の質問に答え、不要な人間の介入を減らす。
BTはタスクロジックを階層的に表現し、複数のロボットポリシー間のリトライ機構と動的切替を可能にする。
カクテル作成タスクの実験により,提案手法は完全なBTの構造的・意味的類似性を保ちながら,人間の反応要求を約27%削減することを示した。
スムージー・メイキング・タスクにおける実ロボット実験は、適応的なポリシー切替と動作障害からの回復による長期実行の成功をさらに証明している。
これらの結果から,実環境におけるロボット作業の実行品質を保ちながら,対話効率を向上させることが示唆された。
関連論文リスト
- H-AIM: Orchestrating LLMs, PDDL, and Behavior Trees for Hierarchical Multi-Robot Planning [3.2800662172795114]
H-AIMは、新しいマルチロボットタスク計画フレームワークである。
命令を解析し、計画ドメイン定義言語(PDDL)問題記述を生成するために、大きな言語モデル(LLM)を利用する。
結果のプランを、リアクティブコントロールのための行動ツリーにコンパイルする。
論文 参考訳(メタデータ) (2026-01-16T07:59:50Z) - REMAC: Self-Reflective and Self-Evolving Multi-Agent Collaboration for Long-Horizon Robot Manipulation [57.628771707989166]
本稿では,ReMACと呼ばれる適応型マルチエージェント計画フレームワークを提案する。
ReMACには2つの重要なモジュールが組み込まれており、ループ内で事前条件と後条件チェックを実行し、進捗と計画の洗練を評価する。
論文 参考訳(メタデータ) (2025-03-28T03:51:40Z) - Agent-Oriented Planning in Multi-Agent Systems [54.429028104022066]
マルチエージェントシステムにおけるエージェント指向計画のための新しいフレームワークであるAOPを提案する。
本研究では, エージェント指向計画の3つの重要な設計原則, 可解性, 完全性, 非冗長性を明らかにする。
大規模実験は,マルチエージェントシステムにおける単一エージェントシステムと既存の計画戦略と比較して,現実の問題を解決する上でのAOPの進歩を実証している。
論文 参考訳(メタデータ) (2024-10-03T04:07:51Z) - COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.24666980374751]
COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。
提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。
実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-09-23T15:53:41Z) - AutoTAMP: Autoregressive Task and Motion Planning with LLMs as Translators and Checkers [20.857692296678632]
人間とロボットの効果的なインタラクションには、ロボットは複雑な長期的タスクを理解し、計画し、実行する必要がある。
大規模言語モデルの最近の進歩は、自然言語をロボットのアクションシーケンスに変換することを約束している。
本研究では,複雑なタスク領域において,LLMをプランナとして用いる手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-10T21:58:29Z) - A Persistent Spatial Semantic Representation for High-level Natural
Language Instruction Execution [54.385344986265714]
本稿では,言語行動とロボット行動のギャップを埋めるために,永続的な空間意味表現法を提案する。
一般的なステップバイステップ命令を完全に回避しながら、ALFREDベンチマークに対する我々のアプローチを評価し、最先端の結果を得る。
論文 参考訳(メタデータ) (2021-07-12T17:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。