論文の概要: TourPlanner: A Competitive Consensus Framework with Constraint-Gated Reinforcement Learning for Travel Planning
- arxiv url: http://arxiv.org/abs/2601.04698v1
- Date: Thu, 08 Jan 2026 08:08:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.099074
- Title: TourPlanner: A Competitive Consensus Framework with Constraint-Gated Reinforcement Learning for Travel Planning
- Title(参考訳): TourPlanner:旅行計画のための制約付き強化学習を備えた競争的合意フレームワーク
- Authors: Yinuo Wang, Mining Tan, Wenxiang Jiao, Xiaoxi Li, Hao Wang, Xuanyu Zhang, Yuan Lu, Weiming Dong,
- Abstract要約: TourPlannerは、マルチパス推論と制約付き強化学習を備えた包括的なフレームワークである。
本研究では,TourPlannerが最先端のパフォーマンスを実現し,既存の手法をはるかに上回っていることを示す。
- 参考スコア(独自算出の注目度): 44.656702093210924
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Travel planning is a sophisticated decision-making process that requires synthesizing multifaceted information to construct itineraries. However, existing travel planning approaches face several challenges: (1) Pruning candidate points of interest (POIs) while maintaining a high recall rate; (2) A single reasoning path restricts the exploration capability within the feasible solution space for travel planning; (3) Simultaneously optimizing hard constraints and soft constraints remains a significant difficulty. To address these challenges, we propose TourPlanner, a comprehensive framework featuring multi-path reasoning and constraint-gated reinforcement learning. Specifically, we first introduce a Personalized Recall and Spatial Optimization (PReSO) workflow to construct spatially-aware candidate POIs' set. Subsequently, we propose Competitive consensus Chain-of-Thought (CCoT), a multi-path reasoning paradigm that improves the ability of exploring the feasible solution space. To further refine the plan, we integrate a sigmoid-based gating mechanism into the reinforcement learning stage, which dynamically prioritizes soft-constraint satisfaction only after hard constraints are met. Experimental results on travel planning benchmarks demonstrate that TourPlanner achieves state-of-the-art performance, significantly surpassing existing methods in both feasibility and user-preference alignment.
- Abstract(参考訳): 旅行計画は複雑な意思決定プロセスであり,複数面情報を合成してイテレーションを構築する必要がある。
しかし,既存の旅行計画手法では,(1)高いリコール率を維持しつつ関心点(POI)を抽出すること,(2)旅行計画のための実現可能なソリューション空間内の探索能力を制限すること,(3)厳密な制約とソフトな制約を同時に最適化することなど,いくつかの課題に直面している。
これらの課題に対処するため,マルチパス推論と制約付き強化学習を備えた総合的なフレームワークであるTourPlannerを提案する。
具体的には、まずPersonalized Recall and Spatial Optimization (PReSO)ワークフローを導入し、空間的に認識されたPOIの集合を構築する。
次に,実現可能な解空間を探索する能力を向上させるマルチパス推論パラダイムであるCompetitive consensus Chain-of-Thought (CCoT)を提案する。
さらに,シグモイドに基づくゲーティング機構を強化学習段階に統合し,厳密な制約が満たされた後にのみソフトコントラストの満足度を動的に優先する。
旅行計画ベンチマークの実験結果から、TourPlannerは最先端のパフォーマンスを達成し、既存の手法をはるかに上回っていることが明らかになった。
関連論文リスト
- ATLAS: Constraints-Aware Multi-Agent Collaboration for Real-World Travel Planning [53.065247112514534]
ATLASは、現実世界の旅行計画タスクにおける制約意識の複雑な性質を扱うために設計された汎用マルチエージェントフレームワークである。
我々はTravelPlannerベンチマークで最先端のパフォーマンスを示し、最終パスレートを23.3%から44.4%に改善した。
論文 参考訳(メタデータ) (2025-09-29T23:23:52Z) - Wide-Horizon Thinking and Simulation-Based Evaluation for Real-World LLM Planning with Multifaceted Constraints [39.01715254437105]
本稿では,多面制約による計画課題を解決するための多面計画(MAoP)について紹介する。
MAoPは直接計画するのではなく、ストラテジストを活用して、さまざまな側面から事前計画を行い、プランナーのための計画青写真を提供する。
論文 参考訳(メタデータ) (2025-06-14T09:37:59Z) - Decomposability-Guaranteed Cooperative Coevolution for Large-Scale Itinerary Planning [6.565536870180592]
大規模反復計画は、旅行セールスマン問題の変種である。
本稿では,大規模反復計画の分解可能性について分析する。
本稿では,大規模反復計画のための新しい多目的協調進化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-06T14:31:57Z) - Flex-TravelPlanner: A Benchmark for Flexible Planning with Language Agents [16.295418365993033]
Flex-TravelPlannerは動的計画シナリオで柔軟に推論できる言語モデルの能力を評価するベンチマークです。
GPT-4o と Llama 3.1 70B を解析したところ,いくつかの重要な所見が得られた。
論文 参考訳(メタデータ) (2025-06-05T05:31:50Z) - Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [74.41886258801209]
本稿では,行動学習から原理的アライメントを分離する2段階の軌道計画フレームワークを提案する。
Plan-R1は計画の安全性と実現可能性を大幅に改善し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-05-23T09:22:19Z) - HyperTree Planning: Enhancing LLM Reasoning via Hierarchical Thinking [109.09735490692202]
提案するHyperTree Planning(HTP)は,高木構造プランニングアウトラインを構成する新しい推論パラダイムである。
実験ではHTPの有効性を実証し、Gemini-1.5-ProによるTravelPlannerベンチマークで最先端の精度を実現し、o1-previewよりも3.6倍の性能向上を実現した。
論文 参考訳(メタデータ) (2025-05-05T02:38:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。