論文の概要: TrajPrism: A Multi-Task Benchmark for Language-Grounded Urban Trajectory Understanding
- arxiv url: http://arxiv.org/abs/2605.10782v1
- Date: Mon, 11 May 2026 16:17:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.972818
- Title: TrajPrism: A Multi-Task Benchmark for Language-Grounded Urban Trajectory Understanding
- Title(参考訳): TrajPrism: 言語中心の都市軌道理解のためのマルチタスクベンチマーク
- Authors: Lihuan Li, Wilson Wongso, Baiyu Chen, Hao Xue, Ruiyi Yang, Yifan Duan, Xiachong Lin, Yang Song, Flora Salim,
- Abstract要約: 言語軌道アライメントのためのマルチタスクベンチマークであるTrajPrismを紹介する。
そこで我々は,トラジャプリズムを実都市軌跡と,トラジャプリズム(TrajPrism)と,トラジャプリズム(TrajPrism)とを組み合わせて構築する。
このベンチマークには、ポルト、サンフランシスコ、北京で選択された300万のトラジェクトリが含まれており、タスクインスタンスは210万である。
- 参考スコア(独自算出の注目度): 9.669733030377632
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban mobility is naturally expressed both as trajectories in space and as natural-language descriptions of travel intent, constraints, and preferences. However, prior work rarely evaluates these two modalities together on the same real-world trajectories: trajectory modeling often stays geometry-centric, while language-centric mobility benchmarks frequently target route planning and tool use rather than fine-grained, verifiable alignment between text and the underlying route. We introduce TrajPrism, a multi-task benchmark for language-trajectory alignment that unifies (i) instruction-conditioned trajectory generation, (ii) language-driven semantic trajectory retrieval, and (iii) trajectory captioning, together with an evaluation protocol that measures trajectory fidelity, retrieval quality, and language groundedness. We construct TrajPrism by pairing real urban trajectories with judge-filtered language annotations generated under a four-dimensional travel-intent taxonomy. The benchmark contains 300K selected trajectories across Porto, San Francisco, and Beijing, yielding 2.1M task instances from three instruction variants, three retrieval queries, and one caption per trajectory. We further develop proof-of-concept models for each task: TrajAnchor for instruction-conditioned trajectory generation, TrajFuse for semantic trajectory retrieval, and TrajRap for trajectory captioning. These models instantiate the proposed tasks and show that geometry-only trajectory baselines leave a large gap on our protocol, especially where language is part of the input-output interface. We release TrajPrism with code and a reproducible annotation pipeline that is designed to be portable across cities, given compatible trajectory inputs and map resources.
- Abstract(参考訳): 都市移動は自然に空間の軌跡として表現され、旅行意図、制約、嗜好の自然言語記述として表現される。
軌跡モデリングはしばしば幾何学中心に留まるが、言語中心のモビリティベンチマークは、テキストと下層のルート間の微妙で検証可能なアライメントではなく、ルート計画とツールの使用をしばしばターゲットとしている。
言語-軌道アライメントのためのマルチタスクベンチマークであるTrajPrismを導入し、統一する。
(i)指示条件付き軌道生成
(二)言語による意味的軌跡の検索、及び
三 軌跡キャプション及び軌跡忠実度、検索品質、言語基盤度を測定する評価プロトコル
実都市軌跡と4次元の旅行性分類の下で生成された判断フィルタ言語アノテーションを組み合わせてTrajPrismを構築した。
このベンチマークには、ポルト、サンフランシスコ、北京で選択された300万のトラジェクトリが含まれており、3つの命令変種から210万のタスクインスタンス、検索クエリ、3つのトラジェクトリ、1つのキャプションがある。
命令条件付き軌道生成のためのTrajAnchor、意味的軌跡検索のためのTrajFuse、軌跡キャプションのためのTrajRap。
これらのモデルは提案したタスクをインスタンス化し、幾何学のみのトラジェクトリベースラインが、特に言語が入力出力インターフェースの一部である場合、我々のプロトコルに大きなギャップを残していることを示す。
私たちはTrajPrismをコードと再現可能なアノテーションパイプラインでリリースしています。
関連論文リスト
- InsTraj: Instructing Diffusion Models with Travel Intentions to Generate Real-world Trajectories [58.29205608173041]
InsTrajは、拡散モデルに自然言語記述から直接高忠実な軌道を生成するよう指示する新しいフレームワークである。
InsTrajは、入力命令に対して現実的で多様で意味論的に忠実な軌跡を生成する際に、最先端の手法を著しく上回ることを示す。
論文 参考訳(メタデータ) (2026-04-05T12:56:55Z) - TrajMamba: An Efficient and Semantic-rich Vehicle Trajectory Pre-training Model [31.21671608884327]
車両GPSは、移動パターンや旅行目的を含む貴重な旅行セマンティクスを保存して、時間の経過とともに車両がどのように動くかを記録している。
旅行セマンティクスを効果的かつ効率的に学習することは、軌道データの現実的な応用に不可欠である。
そこで我々はTrajMambaを提案する。TrajMambaは効率的でセマンティックにリッチな車両軌道学習のための新しいアプローチである。
論文 参考訳(メタデータ) (2025-10-20T13:54:50Z) - TrajSceneLLM: A Multimodal Perspective on Semantic GPS Trajectory Analysis [0.0]
我々は,GPSトラジェクトリのセマンティック理解を強化するためのマルチモーダル視点であるTrajSceneLLMを提案する。
本稿では,旅行選択を分析し,移動行動を理解する上で重要な課題である旅行モード識別(TMI)の枠組みを検証した。
このセマンティックエンハンスメントは、さまざまな下流のアプリケーションや、人工知能の将来の研究に有意義な可能性を約束する。
論文 参考訳(メタデータ) (2025-06-19T15:31:40Z) - EarthMapper: Visual Autoregressive Models for Controllable Bidirectional Satellite-Map Translation [50.433911327489554]
制御可能な衛星マップ翻訳のための新しいフレームワークであるEarthMapperを紹介する。
また,中国38都市を対象とした302,132組の衛星マップからなる大規模データセットであるCNSatMapをコントリビュートした。
CNSatMapとNew Yorkデータセットの実験は、EarthMapperの優れたパフォーマンスを実証している。
論文 参考訳(メタデータ) (2025-04-28T02:41:12Z) - LangNav: Language as a Perceptual Representation for Navigation [63.90602960822604]
視覚・言語ナビゲーション(VLN)における知覚表現としての言語の利用について検討する。
提案手法では,画像キャプションや物体検出に市販の視覚システムを用いて,エージェントのエゴセントリックなパノラマビューを各ステップで自然言語記述に変換する。
論文 参考訳(メタデータ) (2023-10-11T20:52:30Z) - Joint Visual Grounding and Tracking with Natural Language Specification [6.695284124073918]
自然言語仕様による追跡は、自然言語記述に基づくシーケンス内の参照対象の特定を目的としている。
統合されたタスクとしてグラウンドとトラッキングを再構成する統合的な視覚的グラウンドとトラッキングフレームワークを提案する。
本手法は,トラッキングとグラウンドの両方において,最先端のアルゴリズムに対して良好に動作する。
論文 参考訳(メタデータ) (2023-03-21T17:09:03Z) - BEVBert: Multimodal Map Pre-training for Language-guided Navigation [75.23388288113817]
視覚・言語ナビゲーション(VLN)における空間認識型マップベース事前学習パラダイムを提案する。
我々は,グローバルなトポロジカルマップにおけるナビゲーション依存性をモデル化しながら,不完全な観測を明示的に集約し,重複を取り除くための局所距離マップを構築した。
ハイブリッドマップをベースとして,マルチモーダルマップ表現を学習するための事前学習フレームワークを考案し,空間認識型クロスモーダル推論を強化し,言語誘導ナビゲーションの目標を導出する。
論文 参考訳(メタデータ) (2022-12-08T16:27:54Z) - Cross-lingual Spoken Language Understanding with Regularized
Representation Alignment [71.53159402053392]
外部リソースを使わずに言語間で単語レベルの表現と文レベルの表現を整列する正規化手法を提案する。
言語間言語理解タスクの実験により、我々のモデルは、数ショットとゼロショットの両方のシナリオにおいて、最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-09-30T08:56:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。