論文の概要: MapTrace: Scalable Data Generation for Route Tracing on Maps
- arxiv url: http://arxiv.org/abs/2512.19609v1
- Date: Mon, 22 Dec 2025 17:45:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.86277
- Title: MapTrace: Scalable Data Generation for Route Tracing on Maps
- Title(参考訳): MapTrace: マップ上のルートトレースのためのスケーラブルなデータ生成
- Authors: Artemis Panagopoulou, Aveek Purohit, Achin Kulshrestha, Soroosh Yazdani, Mohit Goyal,
- Abstract要約: 合成地図画像と画素レベルの解析を利用して正確なアノテーションを自動生成するスケーラブルな合成データ生成パイプラインを提案する。
我々は、4kマップにまたがる23kパスサンプルの微調整データセットを構築し、モデルがより人間的な空間能力を得ることができるようにした。
MapBenchの結果、ファインタニングはロバスト性を大幅に改善し、成功率を最大6.4ポイント向上し、パストレースエラー(NDTW)を低減した。
- 参考スコア(独自算出の注目度): 6.956796454462474
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: While Multimodal Large Language Models have achieved human-like performance on many visual and textual reasoning tasks, their proficiency in fine-grained spatial understanding, such as route tracing on maps remains limited. Unlike humans, who can quickly learn to parse and navigate maps, current models often fail to respect fundamental path constraints, in part due to the prohibitive cost and difficulty of collecting large-scale, pixel-accurate path annotations. To address this, we introduce a scalable synthetic data generation pipeline that leverages synthetic map images and pixel-level parsing to automatically produce precise annotations for this challenging task. Using this pipeline, we construct a fine-tuning dataset of 23k path samples across 4k maps, enabling models to acquire more human-like spatial capabilities. Using this dataset, we fine-tune both open-source and proprietary MLLMs. Results on MapBench show that finetuning substantially improves robustness, raising success rates by up to 6.4 points, while also reducing path-tracing error (NDTW). These gains highlight that fine-grained spatial reasoning, absent in pretrained models, can be explicitly taught with synthetic supervision.
- Abstract(参考訳): マルチモーダル大規模言語モデルは多くの視覚的およびテキスト的推論タスクにおいて人間のような性能を達成しているが、地図上の経路追跡のような細粒度の空間的理解能力は依然として限られている。
地図のパースとナビゲートを素早く学べる人間とは異なり、現在のモデルは、しばしば基本的なパス制約を尊重することができない。
そこで我々は,この課題に対する正確なアノテーションを自動生成するために,合成マップ画像と画素レベルの解析を利用するスケーラブルな合成データ生成パイプラインを提案する。
このパイプラインを用いて、4kマップにまたがる23kパスサンプルの微調整データセットを構築し、モデルがより人間的な空間能力を得ることを可能にする。
このデータセットを使用して、オープンソースとプロプライエタリなMLLMの両方を微調整します。
MapBenchの結果、微調整はロバスト性を大幅に改善し、成功率を最大6.4ポイント向上し、パストレースエラー(NDTW)も低減した。
これらの成果は、事前訓練されたモデルにないきめ細かい空間的推論が、合成監督によって明示的に教えられることを強調している。
関連論文リスト
- Pathlet Variational Auto-Encoder for Robust Trajectory Generation [16.26294619946259]
軌道生成は近年,プライバシ保護型都市モビリティ研究や位置情報サービスアプリケーションへの関心が高まっている。
本稿では,パスレット表現に基づく深層生成モデルを提案する。このモデルでは,トラジェクトリセグメントの学習辞書に関連付けられた2進ベクトルでトラジェクトリを符号化する。
我々のモデルは、ノイズの多いデータを使ってデータ分散を効果的に学習することができ、2つの現実世界の軌道データセットの強いベースラインに対して、35.4%と26.3%の相対的な改善を実現している。
論文 参考訳(メタデータ) (2025-11-20T06:57:27Z) - Learning to Track Any Points from Human Motion [55.831218129679144]
点追跡のための擬似ラベル付きトレーニングデータを生成する自動パイプラインを提案する。
AnthroTAPでトレーニングされた点追跡モデルは、TAP-Vidベンチマークで注釈付き最先端性能を達成する。
論文 参考訳(メタデータ) (2025-07-08T17:59:58Z) - TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior [70.84644266024571]
我々は、標準定義地図(SDMaps)を見るために知覚モデルを訓練することを提案する。
我々はSDMap要素をニューラル空間マップ表現やインスタンストークンにエンコードし、先行情報のような補完的な特徴を組み込む。
レーンセグメント表現フレームワークに基づいて、モデルはレーン、中心線、およびそれらのトポロジを同時に予測する。
論文 参考訳(メタデータ) (2024-11-22T06:13:42Z) - NLP-enabled Trajectory Map-matching in Urban Road Networks using a Transformer-based Encoder-decoder [1.3812010983144802]
本研究では,NLPにインスパイアされた機械翻訳としてタスクを定式化する,データ駆動型深層学習型マップマッチングフレームワークを提案する。
変圧器を用いたエンコーダ・デコーダモデルでは,ノイズの多いGPS点の文脈表現を学習し,軌道の挙動や道路構造をエンドツーエンドに推定する。
合成軌道実験により、この手法は文脈認識を統合することによって従来の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-04-18T18:39:23Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - VectorMapNet: End-to-end Vectorized HD Map Learning [18.451587680552464]
本稿では,VectorMapNetと呼ばれるエンドツーエンドのベクトル化HDマップ学習パイプラインを紹介する。
このパイプラインは、地図要素間の空間的関係を明示的にモデル化し、下流の自律運転タスクに相応しいベクトル化されたマップを生成することができる。
VectorMapNetはnuScenesとArgo2データセットの両方で強力なマップ学習性能を実現する。
論文 参考訳(メタデータ) (2022-06-17T17:57:13Z) - PreTraM: Self-Supervised Pre-training via Connecting Trajectory and Map [58.53373202647576]
軌道予測のための自己教師付き事前学習方式であるPreTraMを提案する。
1) トラジェクティブ・マップ・コントラクティブ・ラーニング(トラジェクティブ・コントラクティブ・ラーニング)、(2) トラジェクティブ・ラーニング(トラジェクティブ・コントラクティブ・ラーニング)、(2) トラジェクティブ・ラーニング(トラジェクティブ・ラーニング)、(2) トラジェクティブ・コントラクティブ・ラーニング(トラジェクティブ・ラーニング)、(2) トラジェクティブ・コントラクティブ・ラーニング(トラジェクティブ・ラーニング)の2つのパートから構成される。
AgentFormerやTrajectron++といった一般的なベースラインに加えて、PreTraMは、挑戦的なnuScenesデータセット上で、FDE-10でパフォーマンスを5.5%と6.9%向上させる。
論文 参考訳(メタデータ) (2022-04-21T23:01:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。