論文の概要: ATLAS: Constraints-Aware Multi-Agent Collaboration for Real-World Travel Planning
- arxiv url: http://arxiv.org/abs/2509.25586v1
- Date: Mon, 29 Sep 2025 23:23:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.35946
- Title: ATLAS: Constraints-Aware Multi-Agent Collaboration for Real-World Travel Planning
- Title(参考訳): ATLAS:実世界旅行計画のための制約対応マルチエージェントコラボレーション
- Authors: Jihye Choi, Jinsung Yoon, Jiefeng Chen, Somesh Jha, Tomas Pfister,
- Abstract要約: ATLASは、現実世界の旅行計画タスクにおける制約意識の複雑な性質を扱うために設計された汎用マルチエージェントフレームワークである。
我々はTravelPlannerベンチマークで最先端のパフォーマンスを示し、最終パスレートを23.3%から44.4%に改善した。
- 参考スコア(独自算出の注目度): 53.065247112514534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Large Language Models (LLMs) have shown remarkable advancements in reasoning and tool use, they often fail to generate optimal, grounded solutions under complex constraints. Real-world travel planning exemplifies these challenges, evaluating agents' abilities to handle constraints that are explicit, implicit, and even evolving based on interactions with dynamic environments and user needs. In this paper, we present ATLAS, a general multi-agent framework designed to effectively handle such complex nature of constraints awareness in real-world travel planning tasks. ATLAS introduces a principled approach to address the fundamental challenges of constraint-aware planning through dedicated mechanisms for dynamic constraint management, iterative plan critique, and adaptive interleaved search. ATLAS demonstrates state-of-the-art performance on the TravelPlanner benchmark, improving the final pass rate from 23.3% to 44.4% over its best alternative. More importantly, our work is the first to demonstrate quantitative effectiveness on real-world travel planning tasks with live information search and multi-turn feedback. In this realistic setting, ATLAS showcases its superior overall planning performance, achieving an 84% final pass rate which significantly outperforms baselines including ReAct (59%) and a monolithic agent (27%).
- Abstract(参考訳): 大規模言語モデル(LLM)は推論やツールの使用において顕著な進歩を見せているが、しばしば複雑な制約の下で最適で根底的なソリューションを生成することに失敗する。
現実の旅行計画はこれらの課題を実証し、エージェントが明示的で暗黙的、さらには動的環境やユーザニーズとのインタラクションに基づいて進化する制約を扱う能力を評価する。
本稿では,現実の旅行計画タスクにおける制約意識の複雑な性質を効果的に扱うための汎用マルチエージェントフレームワークATLASを提案する。
ATLASは、動的制約管理、反復計画批判、適応的インターリーブ探索のための専用メカニズムを通じて、制約対応計画の基本的な課題に対処する原則的なアプローチを導入している。
ATLASはTravelPlannerベンチマークで最先端のパフォーマンスを示し、最終パスレートを23.3%から44.4%に改善した。
さらに,本研究は,実世界の旅行計画タスクにおいて,ライブ情報検索とマルチターンフィードバックによる定量的な効果を示す最初の試みである。
この現実的な環境では、ATLASはより優れた全体的な計画性能を示し、最終パス率は84%に達し、ReAct(59%)やモノリシックエージェント(27%)といったベースラインを大幅に上回っている。
関連論文リスト
- RETAIL: Towards Real-world Travel Planning for Large Language Models [36.75531019697594]
明示的なクエリをカバーしながら、暗黙的なクエリの意思決定をサポートする新しいデータセット textbfRETAIL を提案する。
また、環境意識が現実のシナリオで計画の実現性を確保すると同時に、オールインワンの旅行計画に詳細なPOI情報を組み込むことも可能である。
実験の結果,最強の既存モデルでさえ11.0%のパス率しか達成していないことが明らかとなった。
論文 参考訳(メタデータ) (2025-08-21T08:08:38Z) - PilotRL: Training Language Model Agents via Global Planning-Guided Progressive Reinforcement Learning [19.480628850056522]
大規模言語モデル(LLM)はエージェント指向タスクの処理において顕著な進歩を見せている。
現在のアプローチは主に教師付き微調整に依存しており、しばしばモデルが確立されたタスク完了軌跡を記憶させる。
適応的グローバルプランベースエージェントパラダイムであるAdaPlanを導入する。
論文 参考訳(メタデータ) (2025-08-01T06:17:11Z) - Plan Your Travel and Travel with Your Plan: Wide-Horizon Planning and Evaluation via LLM [58.50687282180444]
旅行計画は、多様な現実世界の情報とユーザの好みを統合する必要がある複雑な作業である。
我々はこれをL3$プランニング問題として定式化し、長いコンテキスト、長い命令、長い出力を強調する。
計画の多面的側面 (MAoP) を導入し, LLM が複雑な計画問題の解決のために広義の思考を行えるようにした。
論文 参考訳(メタデータ) (2025-06-14T09:37:59Z) - Flex-TravelPlanner: A Benchmark for Flexible Planning with Language Agents [16.295418365993033]
Flex-TravelPlannerは動的計画シナリオで柔軟に推論できる言語モデルの能力を評価するベンチマークです。
GPT-4o と Llama 3.1 70B を解析したところ,いくつかの重要な所見が得られた。
論文 参考訳(メタデータ) (2025-06-05T05:31:50Z) - Vaiage: A Multi-Agent Solution to Personalized Travel Planning [0.27309692684728615]
プランニングトリップは、ユーザの好みの相反、動的な外部情報、多段階の時間空間最適化を含む認知的に集中的なタスクである。
我々のアプローチであるVayageは、目標条件付きレコメンデータとシーケンシャルプランナの両方として機能する、大規模言語モデル(LLM)を中心に構築されたグラフ構造化マルチエージェントフレームワークを通じて、これらの課題に対処します。
自然言語のインタラクション、構造化ツールの使用、マップベースのフィードバックループを通じて、Vaiageは、象徴的推論と会話的理解の両方に根ざした適応的、説明可能、エンドツーエンドの旅行計画を可能にする。
論文 参考訳(メタデータ) (2025-05-16T06:54:52Z) - TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning [39.934634038758404]
本稿では,検索用時間RAG対応旅行計画の最初のベンチマークであるTP-RAGを紹介する。
我々のデータセットには、2,348の現実世界の旅行クエリ、85,575の微粒なPOI、18,784の注釈付きPOIが含まれている。
論文 参考訳(メタデータ) (2025-04-11T17:02:40Z) - EgoPlan-Bench2: A Benchmark for Multimodal Large Language Model Planning in Real-World Scenarios [53.26658545922884]
EgoPlan-Bench2は,MLLMの計画能力を評価するためのベンチマークである。
我々は,21の競争的MLLMを評価し,その限界を詳細に分析した結果,実世界の計画において大きな課題に直面していることが明らかとなった。
EgoPlan-Bench2におけるGPT-4Vの10.24倍の性能向上を図る。
論文 参考訳(メタデータ) (2024-12-05T18:57:23Z) - On The Planning Abilities of OpenAI's o1 Models: Feasibility, Optimality, and Generalizability [59.72892401927283]
さまざまなベンチマークタスクでOpenAIのo1モデルの計画能力を評価する。
その結果,o1-preview は GPT-4 よりもタスク制約に順応していることがわかった。
論文 参考訳(メタデータ) (2024-09-30T03:58:43Z) - DREAMWALKER: Mental Planning for Continuous Vision-Language Navigation [107.5934592892763]
本稿では,世界モデルに基づくVLN-CEエージェントDREAMWALKERを提案する。
世界モデルは、複雑な連続環境の視覚的、位相的、動的特性を要約するために構築される。
コストのかかるアクションを実行する前に、そのような抽象的な世界で可能な計画を完全にシミュレートし、評価することができる。
論文 参考訳(メタデータ) (2023-08-14T23:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。