Fugu-MT 論文翻訳(概要): From Dialogue to Execution: Mixture-of-Agents Assisted Interactive Planning for Behavior Tree-Based Long-Horizon Robot Execution

論文の概要: From Dialogue to Execution: Mixture-of-Agents Assisted Interactive Planning for Behavior Tree-Based Long-Horizon Robot Execution

arxiv url: http://arxiv.org/abs/2603.01113v1
Date: Sun, 01 Mar 2026 13:54:51 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:41.798482
Title: From Dialogue to Execution: Mixture-of-Agents Assisted Interactive Planning for Behavior Tree-Based Long-Horizon Robot Execution
Title（参考訳）: 対話から実行へ:行動木に基づく長距離ロボット実行のための対話型計画支援エージェント
Authors: Kanata Suzuki, Kazuki Hori, Haruka Miyoshi, Shuhei Kurita, Tetsuya Ogata,
Abstract要約: 大型言語モデル(LLM)により、ロボットは自然言語命令からハイレベルなアクションプランを生成することができる。長期的タスクでは、このようなアプローチには多くの疑問が伴い、ユーザの負担が増大する。そこで我々は,Mixture-of-Agents(MoA)ベースのプロキシ応答を対話型プランニングに統合するフレームワークを提案する。
参考スコア（独自算出の注目度）: 10.513251543236684
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Interactive task planning with large language models (LLMs) enables robots to generate high-level action plans from natural language instructions. However, in long-horizon tasks, such approaches often require many questions, increasing user burden. Moreover, flat plan representations become difficult to manage as task complexity grows. We propose a framework that integrates Mixture-of-Agents (MoA)-based proxy answering into interactive planning and generates Behavior Trees (BTs) for structured long-term execution. The MoA consists of multiple LLM-based expert agents that answer general or domain-specific questions when possible, reducing unnecessary human intervention. The resulting BT hierarchically represents task logic and enables retry mechanisms and dynamic switching among multiple robot policies. Experiments on cocktail-making tasks show that the proposed method reduces human response requirements by approximately 27% while maintaining structural and semantic similarity to fully human-answered BTs. Real-robot experiments on a smoothie-making task further demonstrate successful long-horizon execution with adaptive policy switching and recovery from action failures. These results indicate that MoA-assisted interactive planning improves dialogue efficiency while preserving execution quality in real-world robotic tasks.
Abstract（参考訳）: 大規模言語モデル(LLM)を用いた対話型タスクプランニングにより、ロボットは自然言語命令からハイレベルなアクションプランを生成することができる。しかし、長期的タスクでは、このようなアプローチには多くの疑問が伴い、ユーザの負担が増大する。さらに,タスクの複雑さが増大するにつれて,平面計画表現の管理が困難になる。本研究では,Mixture-of-Agents(MoA)ベースのプロキシ応答を対話型プランニングに統合し,長期実行のための動作木(BT)を生成するフレームワークを提案する。 MoAは複数のLSMベースの専門家エージェントで構成されており、一般またはドメイン固有の質問に答え、不要な人間の介入を減らす。 BTはタスクロジックを階層的に表現し、複数のロボットポリシー間のリトライ機構と動的切替を可能にする。カクテル作成タスクの実験により,提案手法は完全なBTの構造的・意味的類似性を保ちながら,人間の反応要求を約27%削減することを示した。スムージー・メイキング・タスクにおける実ロボット実験は、適応的なポリシー切替と動作障害からの回復による長期実行の成功をさらに証明している。これらの結果から,実環境におけるロボット作業の実行品質を保ちながら,対話効率を向上させることが示唆された。

論文の概要: From Dialogue to Execution: Mixture-of-Agents Assisted Interactive Planning for Behavior Tree-Based Long-Horizon Robot Execution

関連論文リスト