論文の概要: TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes
- arxiv url: http://arxiv.org/abs/2412.10308v2
- Date: Tue, 25 Mar 2025 09:18:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-26 20:14:10.507399
- Title: TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes
- Title(参考訳): TrafficLoc:3Dシーンにおける交通監視カメラの配置
- Authors: Yan Xia, Yunxiang Lu, Rui Song, Oussema Dhaouadi, João F. Henriques, Daniel Cremers,
- Abstract要約: 本稿では,画像間クラウド登録(I2P)手法であるTrafficLocを提案する。
大規模な現実世界の交差点データセットの欠如を克服するため、カルラの75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。
我々のTrafficLocは、Carla Intersection上でSOTA I2P法(最大86%)よりも大幅に性能を向上し、実世界のデータに対してよく一般化する。
- 参考スコア(独自算出の注目度): 49.43995864524434
- License:
- Abstract: We tackle the problem of localizing traffic cameras within a 3D reference map and propose a novel image-to-point cloud registration (I2P) method, TrafficLoc, in a coarse-tofine matching fashion. To overcome the lack of large-scale real-world intersection datasets, we first introduce Carla Intersection, a new simulated dataset with 75 urban and rural intersections in Carla. We find that current I2P methods struggle with cross-modal matching under large viewpoint differences, especially at traffic intersections. TrafficLoc thus employs a novel Geometry-guided Attention Loss (GAL) to focus only on the corresponding geometric regions under different viewpoints during 2D-3D feature fusion. To address feature inconsistency in paired image patch-point groups, we further propose Inter-intra Contrastive Learning (ICL) to enhance separating 2D patch/3D group features within each intra-modality and introduce Dense Training Alignment (DTA) with soft-argmax for improving position regression. Extensive experiments show our TrafficLoc greatly improves the performance over the SOTA I2P methods (up to 86%) on Carla Intersection and generalizes well to real-world data. TrafficLoc also achieves new SOTA performance on KITTI and NuScenes datasets, demonstrating the superiority across both in-vehicle and traffic cameras. Our project page is publicly available at https://tum-luk.github.io/projects/trafficloc/.
- Abstract(参考訳): 交通カメラを3次元参照マップ内にローカライズする問題に対処し、粗いマッチング方式で新しい画像-点間クラウド登録(I2P)手法であるTrafficLocを提案する。
大規模な現実世界の交差点データセットの欠如を克服するため、カルラの75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。
現状のI2P手法は,特に交通交差点において,大きな視点差の下でのクロスモーダルマッチングに苦慮していることがわかった。
そこで、TrafficLocは2D-3D機能融合において、対応する幾何学領域のみに焦点を合わせるために、新しい幾何学誘導注意損失(GAL)を採用した。
対画像パッチポイント群の特徴矛盾に対処するため,各モダリティ内における2Dパッチ/3Dグループ特徴の分離を強化するためにICL(Inter-Intra Contrastive Learning)を提案し,位置回帰を改善するためにDense Training Alignment(DTA)を導入した。
大規模な実験により、TrafficLocは、Carla Intersection上のSOTA I2P法(最大86%)よりも大幅に性能を向上し、実世界のデータによく対応していることがわかった。
TrafficLocはまた、KITTIとNuScenesのデータセット上で新たなSOTAパフォーマンスを実現し、車内カメラとトラフィックカメラの両方で優位性を示す。
私たちのプロジェクトページはhttps://tum-luk.github.io/projects/trafficloc/で公開されています。
関連論文リスト
- Geographical Information Alignment Boosts Traffic Analysis via Transpose Cross-attention [4.323740171581589]
地理情報アライメント(GIA)と呼ばれる共通GNNフレームワーク用のプラグイン・アンド・プレイモジュールを提案する。
このモジュールは、新しいTranspose Cross-attentionメカニズムを介して、ノード特徴と地理的位置情報を効率的に融合させることができる。
本手法では,F1スコアの1.3%から10.9%,AUCの0.3%から4.8%の利得が得られる。
論文 参考訳(メタデータ) (2024-12-03T21:04:49Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - Traffic Prediction Framework for OpenStreetMap using Deep Learning based
Complex Event Processing and Open Traffic Cameras [4.6453787256723365]
本稿では,トラフィック推定のためのビデオカメラストリームに依存した深層学習に基づく複合イベント処理(CEP)手法を提案する。
提案フレームワークは,トラフィックに関連する複数の指標を導出するために,カメラクラスタ間でほぼリアルタイムなオブジェクト検出とオブジェクト特性抽出を行う。
このシステムは、ほぼリアルタイムのパフォーマンスが1.42秒、平均Fスコアが0.80である。
論文 参考訳(メタデータ) (2020-07-12T17:10:43Z) - Monocular Vision based Crowdsourced 3D Traffic Sign Positioning with
Unknown Camera Intrinsics and Distortion Coefficients [11.38332845467423]
カメラの焦点距離,主点,歪み係数を事前に知ることなく,3次元信号位置の計算手法を実証する。
我々はそれぞれ0.26mと1.38mの平均的な単行程と絶対的な位置決め精度を達成した。
論文 参考訳(メタデータ) (2020-07-09T07:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。