論文の概要: Think over Trajectories: Leveraging Video Generation to Reconstruct GPS Trajectories from Cellular Signaling
- arxiv url: http://arxiv.org/abs/2603.26610v1
- Date: Fri, 27 Mar 2026 17:07:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.613333
- Title: Think over Trajectories: Leveraging Video Generation to Reconstruct GPS Trajectories from Cellular Signaling
- Title(参考訳): GPSトラジェクトリをセル信号から再構成するビデオ生成技術
- Authors: Ruixing Zhang, Hanzhang Jiang, Leilei Sun, Liangzhe Han, Jibin Wang, Weifeng Lv,
- Abstract要約: 本稿では,Sig2GPS問題について考察する。
このパラダイムをサポートするために、オープンソースのビデオモデルを微調整するために、ペア化されたシグナリング・ツー・トラジェクトリ・ビデオデータセットを構築した。
大規模な実世界のデータセットの実験は、強力なエンジニアリングと学習ベースのベースラインよりも大幅に改善されている。
- 参考スコア(独自算出の注目度): 24.925378866242426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mobile devices continuously interact with cellular base stations, generating massive volumes of signaling records that provide broad coverage for understanding human mobility. However, such records offer only coarse location cues (e.g., serving-cell identifiers) and therefore limit their direct use in applications that require high-precision GPS trajectories. This paper studies the Sig2GPS problem: reconstructing GPS trajectories from cellular signaling. Inspired by domain experts often lay the signaling trace on the map and sketch the corresponding GPS route, unlike conventional solutions that rely on complex multi-stage engineering pipelines or regress coordinates, Sig2GPS is reframed as an image-to-video generation task that directly operates in the map-visual domain: signaling traces are rendered on a map, and a video generation model is trained to draw a continuous GPS path. To support this paradigm, a paired signaling-to-trajectory video dataset is constructed to fine-tune an open-source video model, and a trajectory-aware reinforcement learning-based optimization method is introduced to improve generation fidelity via rewards. Experiments on large-scale real-world datasets show substantial improvements over strong engineered and learning-based baselines, while additional results on next GPS prediction indicate scalability and cross-city transferability. Overall, these results suggest that map-visual video generation provides a practical interface for trajectory data mining by enabling direct generation and refinement of continuous paths under map constraints.
- Abstract(参考訳): モバイルデバイスは、携帯電話基地局と継続的に対話し、人間の移動性を理解するための広範な範囲を提供する大量の信号記録を生成する。
しかし、これらのレコードは、粗い位置手がかり(例えば、サーブセル識別子)しか提供しないため、高精度GPSトラジェクトリを必要とするアプリケーションでの使用を制限している。
本稿では,Sig2GPS問題について考察する。
ドメインの専門家にインスパイアされたSig2GPSは、複雑な多段階のエンジニアリングパイプラインや回帰座標に依存する従来のソリューションとは異なり、地図上に信号トレースを配置し、対応するGPSルートをスケッチすることが多い。
このパラダイムをサポートするために、オープンソースのビデオモデルを微調整するために、ペア・シグナリング・ツー・トラジェクトリ・ビデオデータセットを構築し、報酬による生成忠実度を改善するために、トラジェクトリ・アウェア・強化学習に基づく最適化手法を導入する。
大規模な実世界のデータセットの実験では、強いエンジニアリングと学習ベースのベースラインよりも大幅に改善されている一方、次のGPS予測ではスケーラビリティと都市間転送性を示している。
これらの結果から,地図制約下での連続経路の直接生成と改善を可能にすることにより,地図視覚映像生成がトラジェクティブデータマイニングの実践的インターフェースを提供する可能性が示唆された。
関連論文リスト
- Bayesian-Driven Graph Reasoning for Active Radio Map Construction [96.08082552413117]
本稿では,経路ナビゲーションに適したグラフベースの推論を明示的に活用する不確実性を考慮した無線地図再構成フレームワークを提案する。
提案手法は,(1)空間的不確実性をリアルタイムで推定するベイズニューラルネットワーク,(2)グローバル推論を行う注意に基づく強化学習ポリシの2つの重要な深層学習要素を統合した。
実験の結果,URAMは既存のベースラインよりも最大で34%の精度で復元できることがわかった。
論文 参考訳(メタデータ) (2025-07-29T03:32:01Z) - GPS as a Control Signal for Image Generation [95.43433150105385]
画像メタデータに含まれるGPSタグは,画像生成に有用な制御信号であることを示す。
私たちはGPSと画像のモデルをトレーニングし、都市内の画像がどのように変化するかの詳細な理解を必要とするタスクにそれらを使用します。
論文 参考訳(メタデータ) (2025-01-21T18:59:46Z) - GAReT: Cross-view Video Geolocalization with Adapters and Auto-Regressive Transformers [53.80009458891537]
クロスビュービデオのジオローカライゼーションは、ストリートビュービデオからGPSトラジェクトリを空中ビュー画像と整列させることを目的としている。
現在のCVGL法では、現実のシナリオでは一般的に欠落しているカメラとオドメトリーのデータを使用する。
本稿では,カメラやオドメトリーデータを必要としないCVGLのフルトランスフォーマ方式であるGAReTを提案する。
論文 参考訳(メタデータ) (2024-08-05T21:29:33Z) - NLP-enabled Trajectory Map-matching in Urban Road Networks using a Transformer-based Encoder-decoder [1.3812010983144802]
本研究では,NLPにインスパイアされた機械翻訳としてタスクを定式化する,データ駆動型深層学習型マップマッチングフレームワークを提案する。
変圧器を用いたエンコーダ・デコーダモデルでは,ノイズの多いGPS点の文脈表現を学習し,軌道の挙動や道路構造をエンドツーエンドに推定する。
合成軌道実験により、この手法は文脈認識を統合することによって従来の手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-04-18T18:39:23Z) - Leveraging Driver Field-of-View for Multimodal Ego-Trajectory Prediction [69.29802752614677]
RouteFormerは、GPSデータ、環境コンテキスト、運転者の視野を組み合わせた新しいエゴ軌道予測ネットワークである。
データ不足に対処し、多様性を高めるために、同期運転場と視線データに富んだ都市運転シナリオのデータセットであるGEMを導入する。
論文 参考訳(メタデータ) (2023-12-13T23:06:30Z) - RNTrajRec: Road Network Enhanced Trajectory Recovery with
Spatial-Temporal Transformer [15.350300338463969]
本稿では,道路網を改良したトランスフォーマーベースフレームワーク RNTrajRec を提案する。
RNTrajRecはまずグラフモデル、すなわちGridGNNを使用して、各道路セグメントの埋め込み機能を学ぶ。
次にサブグラフ生成モジュールを導入し、各GPSポイントをGPSポイント周辺の道路ネットワークのサブグラフ構造として表現する。
論文 参考訳(メタデータ) (2022-11-23T11:28:32Z) - ViKiNG: Vision-Based Kilometer-Scale Navigation with Geographic Hints [94.60414567852536]
長距離航法には、計画と局所的な移動可能性の推論の両方が必要である。
学習と計画を統合する学習に基づくアプローチを提案する。
ViKiNGは、画像ベースの学習コントローラを利用できる。
論文 参考訳(メタデータ) (2022-02-23T02:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。