論文の概要: Behavior-Grounded Lane Representation Learning for Multi-Task Traffic Digital Twins
- arxiv url: http://arxiv.org/abs/2605.01901v1
- Date: Sun, 03 May 2026 14:31:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.986093
- Title: Behavior-Grounded Lane Representation Learning for Multi-Task Traffic Digital Twins
- Title(参考訳): マルチタスクトラヒックディジタル双生児のための行動学習型レーン表現学習
- Authors: Rei Tamaru, Pei Li, Bin Ran,
- Abstract要約: 交通デジタル双生児のための行動基底車線表現学習フレームワークGeoLaneRepを紹介する。
GeoLaneRepは、静的レーン幾何学、観測された車両軌跡、および運用ディスクリプタを共有カメラ間のセマンティック埋め込みに共同でエンコードする。
同一の挙動埋め込みが拡散型ジェネレータを条件として,目的とする運用仕様を満たすレーンジオメトリを合成可能であることを示す。
- 参考スコア(独自算出の注目度): 22.723849089108977
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic digital twins are powerful tools for advanced traffic management, and most systems are built on static geometric representations. However, these representations fail to capture the dynamic functional semantics required for behavior-aware reasoning, such as how a lane operates under complex traffic conditions. To address this gap, we introduce GeoLaneRep, a behavior-grounded lane representation learning framework for traffic digital twins. GeoLaneRep jointly encodes static lane geometry, observed vehicle trajectories, and operational descriptors into a shared, cross-camera semantic embedding. The encoder is trained with a joint objective combining contrastive cross-camera alignment, auxiliary role supervision, and temporal anomaly detection. Across 16 roadside cameras and 132 lanes, the learned embeddings achieve a $0.004$ lateral-rank error and an edge-role F1 of $1.000$ in zero-shot cross-camera matching, and an AUROC of $0.991$ for window-level anomaly detection. We further show that the same behavioral embeddings can condition a diffusion-based generator to synthesize lane geometries that satisfy targeted operational specifications, with $87.9\%$ overall specification accuracy across 38 lane groups. GeoLaneRep thus provides a semantic interface between roadside observations and downstream digital twin tasks, supporting cross-camera transfer, behavior-aware monitoring, and goal-directed lane synthesis. The framework is openly available at https://github.com/raynbowy23/GeoLaneRep.
- Abstract(参考訳): トラフィックデジタルツインは高度なトラフィック管理のための強力なツールであり、ほとんどのシステムは静的な幾何学的表現に基づいて構築されている。
しかしながら、これらの表現は、複雑な交通条件下で車線がどのように機能するかなど、行動認識推論に必要な動的な機能的意味を捉えることができない。
このギャップに対処するために,交通デジタル双生児のための行動基底車線表現学習フレームワークGeoLaneRepを紹介する。
GeoLaneRepは、静的レーン幾何学、観測された車両軌跡、および運用ディスクリプタを共有カメラ間のセマンティック埋め込みに共同でエンコードする。
エンコーダは、コントラスト的なクロスカメラアライメント、補助的役割監督、時間的異常検出を組み合わせた共同目標で訓練される。
16台の路面カメラと132車線にまたがって、学習された埋め込みは横方向の誤差0.004ドル、エッジロールF1はゼロショットのクロスカメラマッチングで1,000ドル、AUROCは0.991ドルでウィンドウレベルの異常検出を行う。
さらに、同じ挙動埋め込みが拡散型ジェネレータを条件として、対象とする運用仕様を満たすレーンジオメトリーを合成し、38車線群で全体の仕様精度を87.9 %$に設定できることを示す。
これにより、GeoLaneRepは、路面観察と下流デジタルツインタスク間のセマンティックインターフェースを提供し、クロスカメラ転送、行動認識監視、ゴール指向レーン合成をサポートする。
フレームワークはhttps://github.com/raynbowy23/GeoLaneRepで公開されている。
関連論文リスト
- TopoStreamer: Temporal Lane Segment Topology Reasoning in Autonomous Driving [70.85436371436184]
TopoStreamerは、レーンセグメントトポロジー推論のためのエンドツーエンドの時間知覚モデルである。
TopoStreamerは、ストリーミング属性制約、動的レーン境界位置エンコーディング、およびレーンセグメントのデノイングという3つの重要な改善点を紹介している。
Open-Lane-V2データセットでは、TopoStreamerが最先端のメソッドよりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-07-01T12:10:46Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号システム(TSCS)は、効率的な車両の流れを育むインテリジェントな交通管理に不可欠である。
本稿では,インテリジェントトラフィックエッジネットワークを実現するための新しいTSCSフレームワークを提案する。
我々は,マルチエージェントソフトアクター・クリニック(MA-SAC)強化学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - Graph Attention Network for Lane-Wise and Topology-Invariant Intersection Traffic Simulation [8.600701437207725]
交差点に対する2つの効率的かつ正確な「デジタルツイン」モデルを提案する。
これらのデジタルツインは、交差点内の交通の時間的、空間的、文脈的な側面を捉えている。
本研究の応用は、車線再構成、運転行動分析、交差点の安全性と効率向上に関する情報決定の促進まで及んでいる。
論文 参考訳(メタデータ) (2024-04-11T03:02:06Z) - Laneformer: Object-aware Row-Column Transformers for Lane Detection [96.62919884511287]
Laneformerは、自動運転における車線検出に適したトランスフォーマーベースのアーキテクチャである。
様々な視覚タスクにおけるトランスフォーマーエンコーダ・デコーダアーキテクチャの最近の進歩に触発されて、我々は新しいエンドツーエンドのLaneformerアーキテクチャの設計を進める。
論文 参考訳(メタデータ) (2022-03-18T10:14:35Z) - Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。
本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文 参考訳(メタデータ) (2021-04-19T11:48:13Z) - LDNet: End-to-End Lane Marking Detection Approach Using a Dynamic Vision
Sensor [0.0]
本稿では,イベントカメラを用いたレーンマーキング検出の新たな応用について検討する。
符号化された特徴の空間分解能は、密度の高密度な空間ピラミッドプールブロックによって保持される。
提案手法の有効性をDVSデータセットを用いて評価した。
論文 参考訳(メタデータ) (2020-09-17T02:15:41Z) - Lane Detection Model Based on Spatio-Temporal Network With Double
Convolutional Gated Recurrent Units [11.968518335236787]
レーン検出は今後しばらくは未解決の問題として残るだろう。
二重円錐 Gated Recurrent Units (ConvGRUs) を用いた時空間ネットワークは、困難なシーンにおける車線検出に対処することを提案した。
我々のモデルは最先端の車線検出モデルより優れている。
論文 参考訳(メタデータ) (2020-08-10T06:50:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。