論文の概要: TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning
- arxiv url: http://arxiv.org/abs/2504.08694v1
- Date: Fri, 11 Apr 2025 17:02:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-21 16:12:22.113422
- Title: TP-RAG: Benchmarking Retrieval-Augmented Large Language Model Agents for Spatiotemporal-Aware Travel Planning
- Title(参考訳): TP-RAG:時空間対応旅行計画のための検索型大規模言語モデルエージェントのベンチマーク
- Authors: Hang Ni, Fan Liu, Xinyu Ma, Lixin Su, Shuaiqiang Wang, Dawei Yin, Hui Xiong, Hao Liu,
- Abstract要約: 本稿では,検索用時間RAG対応旅行計画の最初のベンチマークであるTP-RAGを紹介する。
我々のデータセットには、2,348の現実世界の旅行クエリ、85,575の微粒なPOI、18,784の注釈付きPOIが含まれている。
- 参考スコア(独自算出の注目度): 39.934634038758404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have shown promise in automating travel planning, yet they often fall short in addressing nuanced spatiotemporal rationality. While existing benchmarks focus on basic plan validity, they neglect critical aspects such as route efficiency, POI appeal, and real-time adaptability. This paper introduces TP-RAG, the first benchmark tailored for retrieval-augmented, spatiotemporal-aware travel planning. Our dataset includes 2,348 real-world travel queries, 85,575 fine-grain annotated POIs, and 18,784 high-quality travel trajectory references sourced from online tourist documents, enabling dynamic and context-aware planning. Through extensive experiments, we reveal that integrating reference trajectories significantly improves spatial efficiency and POI rationality of the travel plan, while challenges persist in universality and robustness due to conflicting references and noisy data. To address these issues, we propose EvoRAG, an evolutionary framework that potently synergizes diverse retrieved trajectories with LLMs' intrinsic reasoning. EvoRAG achieves state-of-the-art performance, improving spatiotemporal compliance and reducing commonsense violation compared to ground-up and retrieval-augmented baselines. Our work underscores the potential of hybridizing Web knowledge with LLM-driven optimization, paving the way for more reliable and adaptive travel planning agents.
- Abstract(参考訳): 大規模言語モデル (LLM) は旅行計画の自動化において有望であるが, 時空間的有理性に乏しい場合が多い。
既存のベンチマークは基本的な計画の妥当性に重点を置いているが、ルート効率、POIの魅力、リアルタイム適応性といった重要な側面を無視している。
本稿では,検索・拡張・時空間対応旅行計画に適した最初のベンチマークであるTP-RAGを紹介する。
我々のデータセットには, 実世界の旅行クエリ2,348件, 85,575件の微粒な注釈付きPOI, 18,784件のオンライン観光資料からの高品質な旅行トラジェクトリ参照が含まれており, 動的かつコンテキスト対応の計画が可能である。
広範にわたる実験により、参照軌道の統合は旅行計画の空間効率とPOI合理性を大幅に向上させ、一方、競合する参照データやノイズデータにより、普遍性と堅牢性に課題が持続することが明らかとなった。
これらの問題に対処するために,LLMの本質的推論と多種多様な軌跡を強く相乗化する進化的枠組みであるEvoRAGを提案する。
EvoRAGは、最先端のパフォーマンスを実現し、時空間コンプライアンスを改善し、ベースラインのグランドアップや検索に強化されたベースラインと比較してコモンセンス違反を減らす。
我々の研究は、LLMによる最適化とWeb知識のハイブリッド化の可能性を強調し、より信頼性が高く適応的な旅行計画エージェントの道を開いた。
関連論文リスト
- PrismRAG: Boosting RAG Factuality with Distractor Resilience and Strategized Reasoning [57.89188317734747]
PrismRAGはこのモデルを、イントラクタを意識したQAペアで訓練し、金の証拠と微妙なイントラクタパスを混合する。
LLMを計画し、合理化し、人間工学的な指示に頼らずに合成する推論中心の習慣を取り入れている。
論文 参考訳(メタデータ) (2025-07-25T00:15:31Z) - RAD: Retrieval High-quality Demonstrations to Enhance Decision-making [23.136426643341462]
オフライン強化学習(RL)により、エージェントは固定データセットからポリシーを学ぶことができる。
RLはデータセットの空間性や、準最適軌道と専門家軌道の重なり合いの欠如によって制限されることが多い。
本稿では,非パラメトリック検索と拡散に基づく生成モデルを組み合わせた意思決定のための検索高量子デモ(RAD)を提案する。
論文 参考訳(メタデータ) (2025-07-21T08:08:18Z) - The User-Centric Geo-Experience: An LLM-Powered Framework for Enhanced Planning, Navigation, and Dynamic Adaptation [41.25886302818883]
従来の旅行計画システムはしばしば静的で断片化されており、現実の複雑さを扱うには不適当である。
本稿では,既存サービスプロバイダ間でのユーザエクスペリエンスのフラストレーションの原因となる3つのギャップを明らかにする。
複雑なマルチモーダルなユーザクエリの解決を支援するためにグリッドベースの空間接地とマップ分析を利用する旅行計画エージェントと、各旅行の最終ナビゲーション脚のきめ細かいガイダンスを提供する目的地支援エージェントと、画像埋め込みと検索拡張生成(RAG)を活用して旅行計画の中断を検出し、応答する地域発見エージェントの3つの協力エージェントを提案する。
論文 参考訳(メタデータ) (2025-07-09T16:18:09Z) - Plan Your Travel and Travel with Your Plan: Wide-Horizon Planning and Evaluation via LLM [58.50687282180444]
旅行計画は、多様な現実世界の情報とユーザの好みを統合する必要がある複雑な作業である。
我々はこれをL3$プランニング問題として定式化し、長いコンテキスト、長い命令、長い出力を強調する。
計画の多面的側面 (MAoP) を導入し, LLM が複雑な計画問題の解決のために広義の思考を行えるようにした。
論文 参考訳(メタデータ) (2025-06-14T09:37:59Z) - Vaiage: A Multi-Agent Solution to Personalized Travel Planning [0.27309692684728615]
プランニングトリップは、ユーザの好みの相反、動的な外部情報、多段階の時間空間最適化を含む認知的に集中的なタスクである。
我々のアプローチであるVayageは、目標条件付きレコメンデータとシーケンシャルプランナの両方として機能する、大規模言語モデル(LLM)を中心に構築されたグラフ構造化マルチエージェントフレームワークを通じて、これらの課題に対処します。
自然言語のインタラクション、構造化ツールの使用、マップベースのフィードバックループを通じて、Vaiageは、象徴的推論と会話的理解の両方に根ざした適応的、説明可能、エンドツーエンドの旅行計画を可能にする。
論文 参考訳(メタデータ) (2025-05-16T06:54:52Z) - SynthTRIPs: A Knowledge-Grounded Framework for Benchmark Query Generation for Personalized Tourism Recommenders [6.910185679055651]
本稿では,Large Language Models (LLMs) を用いた合成旅行クエリ生成のための新しいSynthTRIPsフレームワークを提案する。
我々のアプローチは、人格に基づく好み(予算、旅行スタイルなど)と明確な持続可能性フィルタ(歩行性、空気質など)を組み合わせることで、現実的で多様なクエリを生成する。
本手法は他の推奨システムドメインにも適用した。
論文 参考訳(メタデータ) (2025-04-12T16:48:35Z) - TripCraft: A Benchmark for Spatio-Temporally Fine Grained Travel Planning [7.841787597078323]
TripCraft は LLM によるパーソナライズされた旅行計画のための,新たなベンチマークを確立している。
パラメータ情報設定は食事スケジューリングを著しく向上させ、7日間のシナリオでは時間的食事スコアが61%から80%に向上する。
論文 参考訳(メタデータ) (2025-02-27T20:33:28Z) - A Real-time Spatio-Temporal Trajectory Planner for Autonomous Vehicles with Semantic Graph Optimization [8.221371036055167]
グラフ最適化に基づく意味的時間的軌道計画法を提案する。
複雑な都市道路のシナリオを効果的に処理し、リアルタイムで実行することができる。
研究コミュニティのベンチマークに対応するため、コードをリリースします。
論文 参考訳(メタデータ) (2025-02-25T12:27:06Z) - DeepRAG: Thinking to Retrieval Step by Step for Large Language Models [92.87532210660456]
我々はマルコフ決定過程(MDP)として検索強化推論をモデル化するDeepRAGを提案する。
クエリを反復的に分解することで、DeepRAGは外部知識を取得するか、あるいは各ステップでパラメトリック推論に依存するかを動的に決定する。
実験の結果、DeepRAGは解答精度を21.99%向上させ、検索強化推論の最適化の有効性を示した。
論文 参考訳(メタデータ) (2025-02-03T08:22:45Z) - ChinaTravel: A Real-World Benchmark for Language Agents in Chinese Travel Planning [50.7898120693695]
ChinaTravelは、中国の旅行計画シナリオに特化して設計されたベンチマークである。
質問紙から旅行要求を収集し,構成的に一般化可能なドメイン特化言語を提案する。
実証研究により、旅行計画における神経象徴薬の可能性を明らかにし、27.9%の制約満足度を達成した。
我々は、オープン言語推論や未確認概念構成など、現実世界の旅行計画展開における重要な課題を特定します。
論文 参考訳(メタデータ) (2024-12-18T10:10:12Z) - P-RAG: Progressive Retrieval Augmented Generation For Planning on Embodied Everyday Task [94.08478298711789]
Embodied Everyday Taskは、インボディードAIコミュニティで人気のあるタスクである。
自然言語命令は明示的なタスクプランニングを欠くことが多い。
タスク環境に関する知識をモデルに組み込むには、広範囲なトレーニングが必要である。
論文 参考訳(メタデータ) (2024-09-17T15:29:34Z) - LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [91.95362946266577]
経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文 参考訳(メタデータ) (2024-06-20T01:24:30Z) - FASTopic: Pretrained Transformer is a Fast, Adaptive, Stable, and Transferable Topic Model [76.509837704596]
本稿では,高速で適応的で,安定で,移動可能なトピックモデルであるFASTopicを提案する。
我々はDSR(Dual Semantic-Relation Reconstruction)を用いて潜在トピックをモデル化する。
また, セマンティック関係を最適輸送計画として正規化するためのETP(Embedding Transport Plan)を提案する。
論文 参考訳(メタデータ) (2024-05-28T09:06:38Z) - LLM-SAP: Large Language Models Situational Awareness Based Planning [0.0]
我々は、潜在的なリスクを予測し、積極的に軽減する方法論を開発するために、マルチエージェント推論フレームワークを使用します。
提案手法は,人間中心のインタラクションの複雑さを計画プロセスに組み込むことによって,従来のオートマトン理論から分岐する。
論文 参考訳(メタデータ) (2023-12-26T17:19:09Z) - Route to Time and Time to Route: Travel Time Estimation from Sparse
Trajectories [7.602975042011819]
本稿では,スパースシナリオにおける旅行時間推定(TTE)と経路回復の問題を解決することを目的とする。
我々は、この問題を、トレーニングデータが粗いラベルを持つ不正確な監督問題として定式化する。
本稿では,推定経路の走行時間をEステップの弱い監督によって推定し,Mステップの走行時間に基づいて経路を抽出するEMアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-21T14:16:58Z) - Adversarial Neural Trip Recommendation [35.70265509185104]
本稿では,これらの課題に対処するための適応型ニューラルトリップ勧告フレームワークを提案する。
まず,POI間の相関関係を学習できる新しいアテンションベースのエンコーダデコーダトリップジェネレータを考案する。
ANTの別の新しい特徴は、高品質な旅行を誘導するために、強化学習と統合された敵対的な学習戦略に依存している。
論文 参考訳(メタデータ) (2021-09-24T03:57:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。