論文の概要: TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes
- arxiv url: http://arxiv.org/abs/2412.10308v1
- Date: Fri, 13 Dec 2024 17:42:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:02:32.872795
- Title: TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes
- Title(参考訳): TrafficLoc:3Dシーンにおける交通監視カメラの配置
- Authors: Yan Xia, Yunxiang Lu, Rui Song, Oussema Dhaouadi, João F. Henriques, Daniel Cremers,
- Abstract要約: 我々は,交通監視カメラを協調的な認識で位置決めする問題に取り組む。
我々は,新しいニューラルネットワークであるTrafficLocを導入し,交通カメラを3次元参照マップ内にローカライズする。
実験の結果,我々のTrafficLocは,最先端のイメージ・ツー・ポイント・クラウド登録方式よりも位置決め精度が向上していることがわかった。
- 参考スコア(独自算出の注目度): 49.43995864524434
- License:
- Abstract: We tackle the problem of localizing the traffic surveillance cameras in cooperative perception. To overcome the lack of large-scale real-world intersection datasets, we introduce Carla Intersection, a new simulated dataset with 75 urban and rural intersections in Carla. Moreover, we introduce a novel neural network, TrafficLoc, localizing traffic cameras within a 3D reference map. TrafficLoc employs a coarse-to-fine matching pipeline. For image-point cloud feature fusion, we propose a novel Geometry-guided Attention Loss to address cross-modal viewpoint inconsistencies. During coarse matching, we propose an Inter-Intra Contrastive Learning to achieve precise alignment while preserving distinctiveness among local intra-features within image patch-point group pairs. Besides, we introduce Dense Training Alignment with a soft-argmax operator to consider additional features when regressing the final position. Extensive experiments show that our TrafficLoc improves the localization accuracy over the state-of-the-art Image-to-point cloud registration methods by a large margin (up to 86%) on Carla Intersection and generalizes well to real-world data. TrafficLoc also achieves new SOTA performance on KITTI and NuScenes datasets, demonstrating strong localization ability across both in-vehicle and traffic cameras. Our project page is publicly available at https://tum-luk.github.io/projects/trafficloc/.
- Abstract(参考訳): 我々は,交通監視カメラを協調的な認識で位置決めする問題に取り組む。
大規模な現実世界の交差点データセットの欠如を克服するため、カルラ市内の75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。
さらに,新しいニューラルネットワークであるTrafficLocを導入し,交通カメラを3次元参照マップ内にローカライズする。
TrafficLocは粗い粒度マッチングパイプラインを採用している。
画像ポイント・クラウド機能融合において, 異種視線不整合に対処する新しいGeometry-Guided Attention Lossを提案する。
粗いマッチングにおいて、画像パッチポイント群内の局所的な特徴の差を保ちながら、正確なアライメントを実現するためのイントラコントラスト学習を提案する。
さらに,Dense Training Alignmentをソフトアルグマックス演算子で導入し,最終位置を後退する際の付加的特徴について考察する。
大規模な実験により、TrafficLocは、カルラ・インターセクションにおいて、最先端のイメージ・ツー・ポイントクラウド登録手法よりも、大きなマージン(最大86%)でローカライズ精度を向上し、実世界のデータによく対応できることが示されている。
TrafficLocはまた、KITTIとNuScenesデータセット上での新たなSOTAパフォーマンスを実現し、車内カメラと交通カメラの両方で強力なローカライゼーション能力を示している。
私たちのプロジェクトページはhttps://tum-luk.github.io/projects/trafficloc/で公開されています。
関連論文リスト
- Geographical Information Alignment Boosts Traffic Analysis via Transpose Cross-attention [4.323740171581589]
地理情報アライメント(GIA)と呼ばれる共通GNNフレームワーク用のプラグイン・アンド・プレイモジュールを提案する。
このモジュールは、新しいTranspose Cross-attentionメカニズムを介して、ノード特徴と地理的位置情報を効率的に融合させることができる。
本手法では,F1スコアの1.3%から10.9%,AUCの0.3%から4.8%の利得が得られる。
論文 参考訳(メタデータ) (2024-12-03T21:04:49Z) - Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - Towards Multi-agent Reinforcement Learning based Traffic Signal Control through Spatio-temporal Hypergraphs [19.107744041461316]
交通信号制御システム(TSCS)は、インテリジェントな交通管理に不可欠なものであり、効率的な車両の流れを育んでいる。
従来のアプローチでは、道路網を標準的なグラフに単純化することが多い。
本稿では,インテリジェントトラフィック制御を実現するための新しいTSCSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-17T02:46:18Z) - iSDF: Real-Time Neural Signed Distance Fields for Robot Perception [64.80458128766254]
iSDFは実時間符号付き距離場再構成のための連続学習システムである。
より正確な再構築と、衝突コストと勾配のより良い近似を生成する。
論文 参考訳(メタデータ) (2022-04-05T15:48:39Z) - Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。
本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。
提案手法は,高品質なトラフィックフローマップを作成できる。
論文 参考訳(メタデータ) (2021-09-29T07:51:49Z) - Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。
既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。
我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文 参考訳(メタデータ) (2020-08-26T16:06:11Z) - Traffic Prediction Framework for OpenStreetMap using Deep Learning based
Complex Event Processing and Open Traffic Cameras [4.6453787256723365]
本稿では,トラフィック推定のためのビデオカメラストリームに依存した深層学習に基づく複合イベント処理(CEP)手法を提案する。
提案フレームワークは,トラフィックに関連する複数の指標を導出するために,カメラクラスタ間でほぼリアルタイムなオブジェクト検出とオブジェクト特性抽出を行う。
このシステムは、ほぼリアルタイムのパフォーマンスが1.42秒、平均Fスコアが0.80である。
論文 参考訳(メタデータ) (2020-07-12T17:10:43Z) - Monocular Vision based Crowdsourced 3D Traffic Sign Positioning with
Unknown Camera Intrinsics and Distortion Coefficients [11.38332845467423]
カメラの焦点距離,主点,歪み係数を事前に知ることなく,3次元信号位置の計算手法を実証する。
我々はそれぞれ0.26mと1.38mの平均的な単行程と絶対的な位置決め精度を達成した。
論文 参考訳(メタデータ) (2020-07-09T07:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。