Fugu-MT 論文翻訳(概要): HiMAP-Travel: Hierarchical Multi-Agent Planning for Long-Horizon Constrained Travel

論文の概要: HiMAP-Travel: Hierarchical Multi-Agent Planning for Long-Horizon Constrained Travel

arxiv url: http://arxiv.org/abs/2603.04750v1
Date: Thu, 05 Mar 2026 02:55:53 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-06 22:06:11.045075
Title: HiMAP-Travel: Hierarchical Multi-Agent Planning for Long-Horizon Constrained Travel
Title（参考訳）: HiMAP-Travel:長距離交通のための階層型マルチエージェント計画
Authors: The Viet Bui, Wenjun Li, Yong Liu,
Abstract要約: 提案する階層型マルチエージェントフレームワークであるHiMAP-Travelは,計画を戦略的コーディネートと並列日次実行に分割する。 TravelPlannerでは、Qwen3-8Bを用いたHiMAP-Travelが52.78%の検証と52.65%のテストファイナルパスレート(FPR)を達成した。
参考スコア（独自算出の注目度）: 17.262462566213244
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Sequential LLM agents fail on long-horizon planning with hard constraints like budgets and diversity requirements. As planning progresses and context grows, these agents drift from global constraints. We propose HiMAP-Travel, a hierarchical multi-agent framework that splits planning into strategic coordination and parallel day-level execution. A Coordinator allocates resources across days, while Day Executors plan independently in parallel. Three key mechanisms enable this: a transactional monitor enforcing budget and uniqueness constraints across parallel agents, a bargaining protocol allowing agents to reject infeasible sub-goals and trigger re-planning, and a single policy trained with GRPO that powers all agents through role conditioning. On TravelPlanner, HiMAP-Travel with Qwen3-8B achieves 52.78% validation and 52.65% test Final Pass Rate (FPR). In a controlled comparison with identical model, training, and tools, it outperforms the sequential DeepTravel baseline by +8.67~pp. It also surpasses ATLAS by +17.65~pp and MTP by +10.0~pp. On FlexTravelBench multi-turn scenarios, it achieves 44.34% (2-turn) and 37.42% (3-turn) FPR while reducing latency 2.5x through parallelization.
Abstract（参考訳）: 連続的なLLMエージェントは、予算や多様性要件といった厳しい制約のある長期計画で失敗する。計画の進展と状況が進むにつれて、これらのエージェントは世界的な制約から逸脱する。提案する階層型マルチエージェントフレームワークであるHiMAP-Travelは,計画を戦略的コーディネートと並列日次実行に分割する。コーディネータは数日にわたってリソースを割り当てるが、Day Executorは独立して並列に計画する。 3つの主要なメカニズムは、並列エージェントにまたがる予算と独自性の制約を強制するトランザクションモニタ、エージェントが無効なサブゴールを拒否し、再計画をトリガーするバリデーションプロトコル、ロールコンディショニングを通じてすべてのエージェントに権限を与えるGRPOでトレーニングされた単一のポリシーである。 TravelPlannerでは、Qwen3-8Bを使用したHiMAP-Travelが52.78%の検証と52.65%のテストファイナルパスレート(FPR)を達成した。同じモデル、トレーニング、ツールと比較して、シーケンシャルなDeepTravelベースラインを+8.67~ppで上回る。 ATLASを+17.65〜ppで、MPPを+10.0〜ppで上回る。 FlexTravelBenchのマルチターンシナリオでは、44.34%(2ターン)と37.42%(3ターン)のFPRを実現し、並列化によるレイテンシ2.5倍の遅延を低減している。

関連論文リスト

Hierarchical LLM-Based Multi-Agent Framework with Prompt Optimization for Multi-Robot Task Planning [0.9453554184019106]
マルチロボットタスクプランニングでは、自然言語命令を実行可能なアクションに分解する必要がある。 PDDLプランナーは厳格な保証を提供するが、曖昧な任務や長期の任務を扱うのに苦労する。高速な最適化が可能な階層型マルチエージェントLSMベースのプランナを提案する。
論文参考訳（メタデータ） (2026-02-25T08:08:26Z)
MagicAgent: Towards Generalized Agent Planning [73.21129030631421]
汎用エージェント計画に特化して設計された基盤モデルである textbfMagicAgent について述べる。多様な計画タスクにまたがる高品質なトラジェクトリを生成する軽量でスケーラブルな合成データフレームワークを提案する。 MagicAgent-32B と MagicAgent-30B-A3B は様々なオープンソースベンチマークにおいて優れた性能を発揮することを示す。
論文参考訳（メタデータ） (2026-02-22T01:39:16Z)
HiPER: Hierarchical Reinforcement Learning with Explicit Credit Assignment for Large Language Model Agents [36.77027704958893]
HiPERは階層的計画実行(Hierarchical Plan-Execute RL)フレームワークで、高レベルの計画と低レベルの実行を分離する。 HiPER は ALFWorld で97.4%、Qwen2.5-7B-Instruct で WebShop で83.3% を達成している。
論文参考訳（メタデータ） (2026-02-18T03:31:34Z)
Programming over Thinking: Efficient and Robust Multi-Constraint Planning [54.77940831026738]
SCOPEは、クエリ固有の推論をジェネリックコード実行から切り離すフレームワークである。 SCOPEは、コストとレイテンシを下げながら最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2026-01-14T02:58:07Z)
Bridging Planning and Execution: Multi-Agent Path Finding Under Real-World Deadlines [9.228609005424348]
時間に敏感なアプリケーションのための実行インフォームドMAPF計画フレームワークであるREMAPを提案する。我々のフレームワークは提案したExecTimeNetを統合し、計画されたパスに基づいて実行時間を正確に推定する。実験の結果、REMAPはベースライン法よりもソリューション品質を最大20%改善することがわかった。
論文参考訳（メタデータ） (2025-11-26T20:08:52Z)
ParaCook: On Time-Efficient Planning for Multi-Agent Systems [62.471032881396496]
大規模言語モデル(LLM)は、長期の現実世界のタスクを計画するための強力な推論能力を示す。時間効率の協調計画のためのベンチマークであるParaCookを紹介する。
論文参考訳（メタデータ） (2025-10-13T16:47:07Z)
Wide-Horizon Thinking and Simulation-Based Evaluation for Real-World LLM Planning with Multifaceted Constraints [39.01715254437105]
本稿では,多面制約による計画課題を解決するための多面計画(MAoP)について紹介する。 MAoPは直接計画するのではなく、ストラテジストを活用して、さまざまな側面から事前計画を行い、プランナーのための計画青写真を提供する。
論文参考訳（メタデータ） (2025-06-14T09:37:59Z)
Decompose, Plan in Parallel, and Merge: A Novel Paradigm for Large Language Models based Planning with Multiple Constraints [31.631832677979826]
本稿では,並列計画パラダイムを提案し,並列におけるサブタスク計画とマージを最終計画(DPPM)に分割する。具体的には、制約に基づいて複雑なタスクをサブタスクに分解し、各サブタスクのサブプランを並列に生成し、それらをグローバルプランにマージする。実験の結果,DPPMは旅行計画タスクにおいて既存の手法よりも有意に優れていた。
論文参考訳（メタデータ） (2025-06-03T09:33:13Z)
Extendable Long-Horizon Planning via Hierarchical Multiscale Diffusion [62.91968752955649]
本稿では,学習データよりも長い軌道計画を行うための,拡張可能な長期計画支援エージェントの課題に対処する。より短いものを縫い合わせることで、より長い軌跡を反復的に生成する拡張法を提案する。 HM-ディフューザーは階層構造を用いてこれらの拡張軌道を訓練し、複数の時間スケールにわたるタスクを効率的に処理する。
論文参考訳（メタデータ） (2025-03-25T22:52:46Z)
Planning with Multi-Constraints via Collaborative Language Agents [13.550774629515843]
本稿では,協調型マルチエージェントシステムのためのゼロショット手法であるPMC(Planning with Multi-Constraints)を紹介する。 PMCは、制約で複雑なタスク計画を簡単にし、従属タスクの階層に分解する。 PMCはTravelPlannerで平均42.68%の成功率を記録し、GPT-4 (2.92%) をはるかに上回り、API-BankでReActを13.64%上回った。
論文参考訳（メタデータ） (2024-05-26T10:33:17Z)
A Feedback Scheme to Reorder a Multi-Agent Execution Schedule by Persistently Optimizing a Switchable Action Dependency Graph [65.70656676650391]
複数の自動誘導車両 (AGV) が共通作業空間をナビゲートし, 様々な作業を行う。一つのアプローチは、Action Dependency Graph (ADG)を構築し、そのルートに沿って進むとAGVの順序を符号化する。ワークスペースが人間やサードパーティロボットのような動的障害によって共有されている場合、AGVは大きな遅延を経験することができる。本稿では,各AGVの経路完了時間を最小限に抑えるために,非循環ADGを繰り返し修正するオンライン手法を提案する。
論文参考訳（メタデータ） (2020-10-11T14:39:50Z)
Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文参考訳（メタデータ） (2020-05-27T01:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。