論文の概要: InsTraj: Instructing Diffusion Models with Travel Intentions to Generate Real-world Trajectories
- arxiv url: http://arxiv.org/abs/2604.04106v1
- Date: Sun, 05 Apr 2026 12:56:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.924672
- Title: InsTraj: Instructing Diffusion Models with Travel Intentions to Generate Real-world Trajectories
- Title(参考訳): InsTraj: 実世界の軌道を生成するための旅行意図付き拡散モデルの指導
- Authors: Yuanshao Zhu, Yuxuan Liang, Xiangyu Zhao, Liang Han, Xinwei Fang, Xuetao Wei, James Jianqiao Yu,
- Abstract要約: InsTrajは、拡散モデルに自然言語記述から直接高忠実な軌道を生成するよう指示する新しいフレームワークである。
InsTrajは、入力命令に対して現実的で多様で意味論的に忠実な軌跡を生成する際に、最先端の手法を著しく上回ることを示す。
- 参考スコア(独自算出の注目度): 58.29205608173041
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The generation of realistic and controllable GPS trajectories is a fundamental task for applications in urban planning, mobility simulation, and privacy-preserving data sharing. However, existing methods face a two-fold challenge: they lack the deep semantic understanding to interpret complex user travel intent, and struggle to handle complex constraints while maintaining the realistic diversity inherent in human behavior. To resolve this, we introduce InsTraj, a novel framework that instructs diffusion models to generate high-fidelity trajectories directly from natural language descriptions. Specifically, InsTraj first utilizes a powerful large language model to decipher unstructured travel intentions formed in natural language, thereby creating rich semantic blueprints and bridging the representation gap between intentions and trajectories. Subsequently, we proposed a multimodal trajectory diffusion transformer that can integrate semantic guidance to generate high-fidelity and instruction-faithful trajectories that adhere to fine-grained user intent. Comprehensive experiments on real-world datasets demonstrate that InsTraj significantly outperforms state-of-the-art methods in generating trajectories that are realistic, diverse, and semantically faithful to the input instructions.
- Abstract(参考訳): 現実的で制御可能なGPSトラジェクトリの生成は、都市計画、モビリティシミュレーション、プライバシ保護データ共有におけるアプリケーションの基本課題である。
しかし、既存の手法では、複雑なユーザ旅行意図を解釈するための深い意味的理解が欠如しており、人間の行動に固有の現実的な多様性を維持しながら、複雑な制約を扱うのに苦労している。
これを解決するために,自然言語記述から直接高忠実な軌跡を生成するための拡散モデルを指示する新しいフレームワークであるInsTrajを導入する。
具体的には、InsTrajはまず強力な大規模言語モデルを使用して、自然言語で形成された構造化されていない旅行意図を解読し、豊かな意味的青写真を作成し、意図と軌道の表現ギャップを埋める。
続いて, ユーザ意図の微粒化に固執する高忠実かつ命令忠実なトラジェクトリを生成するために, セマンティックガイダンスを統合するマルチモーダルトラジェクトリ拡散変換器を提案する。
実世界のデータセットに関する総合的な実験により、InsTrajは入力命令に対して現実的で多様で意味論的に忠実な軌跡を生成する際に、最先端の手法を著しく上回っていることが示された。
関連論文リスト
- Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - TrajSceneLLM: A Multimodal Perspective on Semantic GPS Trajectory Analysis [0.0]
我々は,GPSトラジェクトリのセマンティック理解を強化するためのマルチモーダル視点であるTrajSceneLLMを提案する。
本稿では,旅行選択を分析し,移動行動を理解する上で重要な課題である旅行モード識別(TMI)の枠組みを検証した。
このセマンティックエンハンスメントは、さまざまな下流のアプリケーションや、人工知能の将来の研究に有意義な可能性を約束する。
論文 参考訳(メタデータ) (2025-06-19T15:31:40Z) - LANGTRAJ: Diffusion Model and Dataset for Language-Conditioned Trajectory Simulation [102.1527101235251]
LangTrajは、トラフィックシナリオにおけるすべてのエージェントの共同動作をシミュレートする、言語条件のシーン拡散モデルである。
自然言語入力を条件付けすることで、LangTrajはインタラクティブな振る舞いを柔軟かつ直感的に制御できる。
LangTraj氏は、リアリズム、言語制御性、言語条件の安全クリティカルなシミュレーションにおいて、強力なパフォーマンスを示している。
論文 参考訳(メタデータ) (2025-04-15T17:14:06Z) - Holistic Semantic Representation for Navigational Trajectory Generation [33.55971756543447]
ナビゲーション生成のためのHOSER(Holistic Semantic Representation)フレームワークを開発した。
我々は,HOSERが最先端のベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2025-01-06T03:11:12Z) - UniTraj: Learning a Universal Trajectory Foundation Model from Billion-Scale Worldwide Traces [64.24594320103066]
ユニバーサルな軌跡基礎モデルを構築することは、既存の軌跡モデリングアプローチの限界に対処するための有望な解決策である。
以下、UniTrajを紹介します。UniTrajは3つの重要なイノベーションを通じてこれらの制限に対処することを目的としています。
まず、70か国にまたがる数十億のGPSポイントを持つ、前例のない245万のトラジェクトリのデータセットであるWorldTraceを構築します。
論文 参考訳(メタデータ) (2024-11-06T12:06:43Z) - Deciphering Human Mobility: Inferring Semantics of Trajectories with Large Language Models [10.841035090991651]
本稿では,ユーザの職業カテゴリー,活動,シーケンス,軌道記述の3つの重要な側面を通じて意味推論を定義する。
本稿では,トラジェクトリデータのセマンティック分析を活用するために,大規模言語モデルを用いたトラジェクトリ意味推論(TSI-LLM)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-30T08:55:48Z) - ControlTraj: Controllable Trajectory Generation with Topology-Constrained Diffusion Model [39.0442700565278]
ControlTrajは、トポロジ制約付き拡散モデルを備えた、制御可能なトラジェクトリ生成フレームワークである。
道路セグメントの微細な埋め込みを抽出する新しい道路セグメントオートエンコーダを開発した。
符号化された特徴とトリップ属性は、後に提案された地理的なUNetアーキテクチャにマージされる。
論文 参考訳(メタデータ) (2024-04-23T09:42:45Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Learning to Move with Affordance Maps [57.198806691838364]
物理的な空間を自律的に探索し、ナビゲートする能力は、事実上あらゆる移動型自律エージェントの基本的な要件である。
従来のSLAMベースの探索とナビゲーションのアプローチは、主にシーン幾何学の活用に重点を置いている。
学習可能な余剰マップは探索と航法の両方において従来のアプローチの強化に利用でき、性能が大幅に向上することを示します。
論文 参考訳(メタデータ) (2020-01-08T04:05:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。