論文の概要: TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning
- arxiv url: http://arxiv.org/abs/2504.08694v1
- Date: Fri, 11 Apr 2025 17:02:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-14 14:19:13.382200
- Title: TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning
- Title(参考訳): TP-RAG:時空間対応旅行計画のための検索型大規模言語モデルエージェントのベンチマーク
- Authors: Hang Ni, Fan Liu, Xinyu Ma, Lixin Su, Shuaiqiang Wang, Dawei Yin, Hui Xiong, Hao Liu,
- Abstract要約: 本稿では,検索用時間RAG対応旅行計画の最初のベンチマークであるTP-RAGを紹介する。
我々のデータセットには、2,348の現実世界の旅行クエリ、85,575の微粒なPOI、18,784の注釈付きPOIが含まれている。
- 参考スコア(独自算出の注目度): 39.934634038758404
- License:
- Abstract: Large language models (LLMs) have shown promise in automating travel planning, yet they often fall short in addressing nuanced spatiotemporal rationality. While existing benchmarks focus on basic plan validity, they neglect critical aspects such as route efficiency, POI appeal, and real-time adaptability. This paper introduces TP-RAG, the first benchmark tailored for retrieval-augmented, spatiotemporal-aware travel planning. Our dataset includes 2,348 real-world travel queries, 85,575 fine-grain annotated POIs, and 18,784 high-quality travel trajectory references sourced from online tourist documents, enabling dynamic and context-aware planning. Through extensive experiments, we reveal that integrating reference trajectories significantly improves spatial efficiency and POI rationality of the travel plan, while challenges persist in universality and robustness due to conflicting references and noisy data. To address these issues, we propose EvoRAG, an evolutionary framework that potently synergizes diverse retrieved trajectories with LLMs' intrinsic reasoning. EvoRAG achieves state-of-the-art performance, improving spatiotemporal compliance and reducing commonsense violation compared to ground-up and retrieval-augmented baselines. Our work underscores the potential of hybridizing Web knowledge with LLM-driven optimization, paving the way for more reliable and adaptive travel planning agents.
- Abstract(参考訳): 大規模言語モデル (LLM) は旅行計画の自動化において有望であるが, 時空間的有理性に乏しい場合が多い。
既存のベンチマークは基本的な計画の妥当性に重点を置いているが、ルート効率、POIの魅力、リアルタイム適応性といった重要な側面を無視している。
本稿では,検索・拡張・時空間対応旅行計画に適した最初のベンチマークであるTP-RAGを紹介する。
我々のデータセットには, 実世界の旅行クエリ2,348件, 85,575件の微粒な注釈付きPOI, 18,784件のオンライン観光資料からの高品質な旅行トラジェクトリ参照が含まれており, 動的かつコンテキスト対応の計画が可能である。
広範にわたる実験により、参照軌道の統合は旅行計画の空間効率とPOI合理性を大幅に向上させ、一方、競合する参照データやノイズデータにより、普遍性と堅牢性に課題が持続することが明らかとなった。
これらの問題に対処するために,LLMの本質的推論と多種多様な軌跡を強く相乗化する進化的枠組みであるEvoRAGを提案する。
EvoRAGは、最先端のパフォーマンスを実現し、時空間コンプライアンスを改善し、ベースラインのグランドアップや検索に強化されたベースラインと比較してコモンセンス違反を減らす。
我々の研究は、LLMによる最適化とWeb知識のハイブリッド化の可能性を強調し、より信頼性が高く適応的な旅行計画エージェントの道を開いた。
関連論文リスト
- DeepRAG: Thinking to Retrieval Step by Step for Large Language Models [92.87532210660456]
我々はマルコフ決定過程(MDP)として検索強化推論をモデル化するDeepRAGを提案する。
クエリを反復的に分解することで、DeepRAGは外部知識を取得するか、あるいは各ステップでパラメトリック推論に依存するかを動的に決定する。
実験の結果、DeepRAGは解答精度を21.99%向上させ、検索強化推論の最適化の有効性を示した。
論文 参考訳(メタデータ) (2025-02-03T08:22:45Z) - ChinaTravel: A Real-World Benchmark for Language Agents in Chinese Travel Planning [50.7898120693695]
ChinaTravelは、中国の旅行計画シナリオに特化して設計されたベンチマークである。
質問紙から旅行要求を収集し,構成的に一般化可能なドメイン特化言語を提案する。
実証研究により、旅行計画における神経象徴薬の可能性を明らかにし、27.9%の制約満足度を達成した。
我々は、オープン言語推論や未確認概念構成など、現実世界の旅行計画展開における重要な課題を特定します。
論文 参考訳(メタデータ) (2024-12-18T10:10:12Z) - P-RAG: Progressive Retrieval Augmented Generation For Planning on Embodied Everyday Task [94.08478298711789]
Embodied Everyday Taskは、インボディードAIコミュニティで人気のあるタスクである。
自然言語命令は明示的なタスクプランニングを欠くことが多い。
タスク環境に関する知識をモデルに組み込むには、広範囲なトレーニングが必要である。
論文 参考訳(メタデータ) (2024-09-17T15:29:34Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - Interpretable Cascading Mixture-of-Experts for Urban Traffic Congestion Prediction [24.26429523848735]
急速な都市化は交通渋滞を著しくエスカレートさせ、高度な渋滞予測サービスの必要性を浮き彫りにした。
本稿では,CP-MoE(Congestion Prediction Mixture-of-Experts)を提案する。
CP-MoEは、旅行時間推定システムの精度と信頼性を向上させるため、DiDiに展開されている。
論文 参考訳(メタデータ) (2024-06-14T12:57:17Z) - FASTopic: Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model [76.509837704596]
本稿では,高速で適応的で,安定で,移動可能なトピックモデルであるFASTopicを提案する。
我々はDSR(Dual Semantic-Relation Reconstruction)を用いて潜在トピックをモデル化する。
また, セマンティック関係を最適輸送計画として正規化するためのETP(Embedding Transport Plan)を提案する。
論文 参考訳(メタデータ) (2024-05-28T09:06:38Z) - Learning-Initialized Trajectory Planning in Unknown Environments [4.2960463890487555]
未知の環境での自律飛行の計画には、空間軌道と時間軌道の両方を正確に計画する必要がある。
本稿ではニューラルdトラジェクトリ・プランナーを用いて最適化を導く新しい手法を提案する。
遅延計画に対する耐性を持って、堅牢なオンラインリプランニングをサポートするフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-19T15:07:26Z) - Route to Time and Time to Route: Travel Time Estimation from Sparse
Trajectories [7.602975042011819]
本稿では,スパースシナリオにおける旅行時間推定(TTE)と経路回復の問題を解決することを目的とする。
我々は、この問題を、トレーニングデータが粗いラベルを持つ不正確な監督問題として定式化する。
本稿では,推定経路の走行時間をEステップの弱い監督によって推定し,Mステップの走行時間に基づいて経路を抽出するEMアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-21T14:16:58Z) - Adversarial Neural Trip Recommendation [35.70265509185104]
本稿では,これらの課題に対処するための適応型ニューラルトリップ勧告フレームワークを提案する。
まず,POI間の相関関係を学習できる新しいアテンションベースのエンコーダデコーダトリップジェネレータを考案する。
ANTの別の新しい特徴は、高品質な旅行を誘導するために、強化学習と統合された敵対的な学習戦略に依存している。
論文 参考訳(メタデータ) (2021-09-24T03:57:25Z) - Adaptive Selection of Informative Path Planning Strategies via
Reinforcement Learning [6.015556590955814]
ローカルプランニング」アプローチでは,次回のサンプリング場所の優先順位が予測性能や帰路距離に与える影響を調査するために,様々な空間範囲が採用されている。
温度モニタリングロボットの使用事例実験により、プランナーの動的混合物は高度な情報プランを生成できるだけでなく、予測信頼性を犠牲にすることなく、大幅に距離を縮めることができることが示された。
論文 参考訳(メタデータ) (2021-08-14T21:32:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。