論文の概要: TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation
- arxiv url: http://arxiv.org/abs/2605.22355v1
- Date: Thu, 21 May 2026 11:42:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.234867
- Title: TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation
- Title(参考訳): TransitLM: マップフリー経路生成のための大規模データセットとベンチマーク
- Authors: Hanyu Guo, Jiedong Yang, Chao Chen, Longfei Xu, Kaikui Liu, Xiangxiang Chu,
- Abstract要約: 我々は、中国4都市から120,845の駅と13,666の路線を含む1300万以上の交通ルート計画記録を収集した大規模なデータセットであるTransitLMを提示する。
実験により、トランジットLMで訓練されたLLMは、構造的に妥当なルートを高精度に生成し、任意のGPS座標を適切な駅に暗黙的に接地することを示した。
- 参考スコア(独自算出の注目度): 18.721623620233107
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Public transit route planning traditionally depends on structured map infrastructure and complex routing engines, and no existing dataset supports training models to bypass this dependency. We present TransitLM, a large-scale dataset of over 13 million transit route planning records from four Chinese cities covering 120,845 stations and 13,666 lines, released as a continual pre-training corpus and benchmark data for three evaluation tasks with complementary metrics. Experiments show that an LLM trained on TransitLM produces structurally valid routes at high accuracy and implicitly grounds arbitrary GPS coordinates to appropriate stations without any explicit mapping. These results demonstrate that transit route planning can be learned entirely from data, enabling end-to-end, map-free route generation directly from origin-destination information. The dataset and benchmark are available at https://huggingface.co/datasets/GD-ML/TransitLM, with evaluation code at https://github.com/HotTricker/TransitLM.
- Abstract(参考訳): 公共交通ルートの計画は、伝統的に構造化されたマップインフラストラクチャと複雑なルーティングエンジンに依存しており、既存のデータセットはこの依存関係をバイパスするトレーニングモデルをサポートしない。
我々は,中国の4都市から120,845の駅と13,666の路線を含む1300万以上の交通経路計画記録の大規模データセットであるTransitLMを,連続的な事前学習コーパスと3つの評価タスクのためのベンチマークデータとしてリリースした。
実験により、トランジットLMで訓練されたLLMは、構造的に妥当なルートを高精度に生成し、任意のGPS座標を明示的なマッピングなしで適切な駅に暗黙的に接地することを示した。
これらの結果は,交通経路計画がデータから完全に学習できることを示し,原点決定情報から直接エンド・ツー・エンドの地図のない経路生成を可能にする。
データセットとベンチマークはhttps://huggingface.co/datasets/GD-ML/TransitLMで、評価コードはhttps://github.com/HotTricker/TransitLMで公開されている。
関連論文リスト
- Fusing Cellular Network Data and Tollbooth Counts for Urban Traffic Flow Estimation [0.0]
都市交通インフラの介入計画に不可欠な交通シミュレーションには、オリジン・デスティネーション(OD)データが必要である。
Sparse tollboothセンサーは、カテゴリーごとの正確な車両数を提供し、セルラーネットワークからの広範なモビリティデータは、集約された群衆の動きをキャプチャする。
本研究では,スパース・トールボース数を用いてセルラーネットワークデータを正解する機械学習フレームワークを開発した。
論文 参考訳(メタデータ) (2026-04-17T07:40:10Z) - OpenNavMap: Structure-Free Topometric Mapping via Large-Scale Collaborative Localization [12.686154192361913]
OpenNavMapは、オンデマンドの再構築に3D幾何学的基礎モデルを活用する軽量で構造のないトポロジカルシステムである。
提案手法は,動的プログラミングに基づくシーケンスマッチング,幾何検証,信頼性校正最適化を,頑健で粗いサブマップアライメントに統一する。
Map-Freeベンチマークの評価は、平均翻訳誤差0.62mを達成し、構造移動ベースラインと回帰ベースラインよりも優れた精度を示す。
論文 参考訳(メタデータ) (2026-01-18T07:24:46Z) - TurnBack: A Geospatial Route Cognition Benchmark for Large Language Models through Reverse Route [45.16008377814563]
世界中の12の都市から36000のルートからなる大規模評価データセットを作成しました。
自然言語命令をナビゲーションルートに変換する新しいツールであるPathBuilderを紹介する。
経路反転の課題に対して,11のSOTA (State-of-the-art) LLMを厳格に評価する。
論文 参考訳(メタデータ) (2025-09-17T15:00:03Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - NLP-enabled Trajectory Map-matching in Urban Road Networks using a Transformer-based Encoder-decoder [1.3812010983144802]
本研究では,NLPにインスパイアされた機械翻訳としてタスクを定式化する,データ駆動型深層学習型マップマッチングフレームワークを提案する。
変圧器を用いたエンコーダ・デコーダモデルでは,ノイズの多いGPS点の文脈表現を学習し,軌道の挙動や道路構造をエンドツーエンドに推定する。
合成軌道実験により、この手法は文脈認識を統合することによって従来の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-04-18T18:39:23Z) - Navya3DSeg -- Navya 3D Semantic Segmentation Dataset & split generation
for autonomous vehicles [63.20765930558542]
3Dセマンティックデータは、障害物検出やエゴ-車両の局所化といった中核的な認識タスクに有用である。
そこで我々は,大規模生産段階の運用領域に対応する多様なラベル空間を持つ新しいデータセットであるNavala 3D(Navya3DSeg)を提案する。
ラベルのない23のラベル付きシーケンスと25の補足シーケンスが含まれており、ポイントクラウド上の自己教師付きおよび半教師付きセマンティックセマンティックセグメンテーションベンチマークを探索するために設計された。
論文 参考訳(メタデータ) (2023-02-16T13:41:19Z) - PreTraM: Self-Supervised Pre-training via Connecting Trajectory and Map [58.53373202647576]
軌道予測のための自己教師付き事前学習方式であるPreTraMを提案する。
1) トラジェクティブ・マップ・コントラクティブ・ラーニング(トラジェクティブ・コントラクティブ・ラーニング)、(2) トラジェクティブ・ラーニング(トラジェクティブ・コントラクティブ・ラーニング)、(2) トラジェクティブ・ラーニング(トラジェクティブ・ラーニング)、(2) トラジェクティブ・コントラクティブ・ラーニング(トラジェクティブ・ラーニング)、(2) トラジェクティブ・コントラクティブ・ラーニング(トラジェクティブ・ラーニング)の2つのパートから構成される。
AgentFormerやTrajectron++といった一般的なベースラインに加えて、PreTraMは、挑戦的なnuScenesデータセット上で、FDE-10でパフォーマンスを5.5%と6.9%向上させる。
論文 参考訳(メタデータ) (2022-04-21T23:01:21Z) - Pit30M: A Benchmark for Global Localization in the Age of Self-Driving Cars [39.94419250485135]
Pit30Mは3000万フレームを超える新しい画像とLiDARデータセットで、これは以前の研究の10倍から100倍の大きさだ。
Pit30Mは様々な条件(季節、天気、日時、交通量)で捕獲され、正確な位置決めの真実を提供する。
我々は、画像とLiDAR検索のための既存の複数の手法をベンチマークし、その過程で、単純で効果的な畳み込みネットワークに基づくLiDAR検索手法を導入する。
論文 参考訳(メタデータ) (2020-12-23T01:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。