Fugu-MT 論文翻訳(概要): TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes

論文の概要: TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes

arxiv url: http://arxiv.org/abs/2412.10308v2
Date: Tue, 25 Mar 2025 09:18:04 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-26 21:56:47.150433
Title: TrafficLoc: Localizing Traffic Surveillance Cameras in 3D Scenes
Title（参考訳）: TrafficLoc:3Dシーンにおける交通監視カメラの配置
Authors: Yan Xia, Yunxiang Lu, Rui Song, Oussema Dhaouadi, João F. Henriques, Daniel Cremers,
Abstract要約: 本稿では,画像間クラウド登録(I2P)手法であるTrafficLocを提案する。大規模な現実世界の交差点データセットの欠如を克服するため、カルラの75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。我々のTrafficLocは、Carla Intersection上でSOTA I2P法(最大86%)よりも大幅に性能を向上し、実世界のデータに対してよく一般化する。
参考スコア（独自算出の注目度）: 49.43995864524434
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We tackle the problem of localizing traffic cameras within a 3D reference map and propose a novel image-to-point cloud registration (I2P) method, TrafficLoc, in a coarse-tofine matching fashion. To overcome the lack of large-scale real-world intersection datasets, we first introduce Carla Intersection, a new simulated dataset with 75 urban and rural intersections in Carla. We find that current I2P methods struggle with cross-modal matching under large viewpoint differences, especially at traffic intersections. TrafficLoc thus employs a novel Geometry-guided Attention Loss (GAL) to focus only on the corresponding geometric regions under different viewpoints during 2D-3D feature fusion. To address feature inconsistency in paired image patch-point groups, we further propose Inter-intra Contrastive Learning (ICL) to enhance separating 2D patch/3D group features within each intra-modality and introduce Dense Training Alignment (DTA) with soft-argmax for improving position regression. Extensive experiments show our TrafficLoc greatly improves the performance over the SOTA I2P methods (up to 86%) on Carla Intersection and generalizes well to real-world data. TrafficLoc also achieves new SOTA performance on KITTI and NuScenes datasets, demonstrating the superiority across both in-vehicle and traffic cameras. Our project page is publicly available at https://tum-luk.github.io/projects/trafficloc/.
Abstract（参考訳）: 交通カメラを3次元参照マップ内にローカライズする問題に対処し、粗いマッチング方式で新しい画像-点間クラウド登録(I2P)手法であるTrafficLocを提案する。大規模な現実世界の交差点データセットの欠如を克服するため、カルラの75の都市と農村の交差点を持つ新しいシミュレーションデータセットであるCarla Intersectionを紹介した。現状のI2P手法は,特に交通交差点において,大きな視点差の下でのクロスモーダルマッチングに苦慮していることがわかった。そこで、TrafficLocは2D-3D機能融合において、対応する幾何学領域のみに焦点を合わせるために、新しい幾何学誘導注意損失(GAL)を採用した。対画像パッチポイント群の特徴矛盾に対処するため,各モダリティ内における2Dパッチ/3Dグループ特徴の分離を強化するためにICL(Inter-Intra Contrastive Learning)を提案し,位置回帰を改善するためにDense Training Alignment(DTA)を導入した。大規模な実験により、TrafficLocは、Carla Intersection上のSOTA I2P法(最大86%)よりも大幅に性能を向上し、実世界のデータによく対応していることがわかった。 TrafficLocはまた、KITTIとNuScenesのデータセット上で新たなSOTAパフォーマンスを実現し、車内カメラとトラフィックカメラの両方で優位性を示す。私たちのプロジェクトページはhttps://tum-luk.github.io/projects/trafficloc/で公開されています。

関連論文リスト

Geographical Information Alignment Boosts Traffic Analysis via Transpose Cross-attention [4.323740171581589]
地理情報アライメント(GIA)と呼ばれる共通GNNフレームワーク用のプラグイン・アンド・プレイモジュールを提案する。このモジュールは、新しいTranspose Cross-attentionメカニズムを介して、ノード特徴と地理的位置情報を効率的に融合させることができる。本手法では,F1スコアの1.3%から10.9%,AUCの0.3%から4.8%の利得が得られる。
論文参考訳（メタデータ） (2024-12-03T21:04:49Z)
Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文参考訳（メタデータ） (2024-10-10T10:10:03Z)
GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文参考訳（メタデータ） (2024-06-06T17:59:50Z)
Elastic Interaction Energy-Informed Real-Time Traffic Scene Perception [8.429178814528617]
EIEGSegという名前のトポロジ対応エネルギー損失関数に基づくネットワークトレーニング戦略を提案する。 EIEGSegは、リアルタイムの交通シーン認識におけるマルチクラスセグメンテーションのために設計されている。以上の結果から,EIEGSegは,特にリアルタイム軽量ネットワークにおいて,性能を継続的に向上することを示す。
論文参考訳（メタデータ） (2023-10-02T01:30:42Z)
CLiNet: Joint Detection of Road Network Centerlines in 2D and 3D [5.543544712471748]
本研究は,2次元と3次元で共同で特徴をローカライズすることで,画像データに基づく中心線の共同検出のための新しいアプローチを提案する。 AV Breadcrumbsと呼ばれる大規模都市走行データセットをベクトル地図表現と射影幾何学を利用して自動的にラベル付けし,900,000以上の画像に注釈を付ける。
論文参考訳（メタデータ） (2023-02-04T23:30:04Z)
PersFormer: 3D Lane Detection via Perspective Transformer and the OpenLane Benchmark [109.03773439461615]
PersFormerは、新しいトランスフォーマーベースの空間特徴変換モジュールを備えた、エンドツーエンドのモノクル3Dレーン検出器である。高品質なアノテーションとシナリオの多様性を備えたOpenLaneと呼ばれる,最初の大規模な3Dレーンデータセットの1つをリリースしました。
論文参考訳（メタデータ） (2022-03-21T16:12:53Z)
3D Scene Understanding at Urban Intersection using Stereo Vision and Digital Map [4.640144833676576]
都市交差点における交通状況の空間的・時間的解析にステレオビジョンと3次元ディジタルマップを用いた手法を提案する。東京都の都市キャニオンで収集した実交通データに対して,提案手法を質的,定量的に評価し,システムの有効性を実証した。
論文参考訳（メタデータ） (2021-12-10T02:05:15Z)
Road Network Guided Fine-Grained Urban Traffic Flow Inference [108.64631590347352]
粗いトラフィックからのきめ細かなトラフィックフローの正確な推測は、新たな重要な問題である。本稿では,道路ネットワークの知識を活かした新しい道路対応交通流磁化器(RATFM)を提案する。提案手法は,高品質なトラフィックフローマップを作成できる。
論文参考訳（メタデータ） (2021-09-29T07:51:49Z)
Automatic Map Update Using Dashcam Videos [1.6911482053867475]
実時間変化検出と局所化に着目したSfMベースの自動マップ更新ソリューションを提案する。本システムでは,スパースSfM点雲を用いて,2次元画像から検出した物体を3次元空間内に検出することができる。
論文参考訳（メタデータ） (2021-09-24T18:00:57Z)
Robust 2D/3D Vehicle Parsing in CVIS [54.825777404511605]
本研究では,協調型車両インフラシステム(CVIS)の一環として,異なるカメラビューの車両を堅牢に検出・認識する新しいアプローチを提案する。提案方式は任意のカメラビュー向けに設計されており,本質的パラメータや外部的パラメータを仮定しない。実際に,本手法は2次元検出,インスタンスセグメンテーション,6-DoFのポーズ推定においてSOTA法より優れている。
論文参考訳（メタデータ） (2021-03-11T03:35:05Z)
Fine-Grained Vehicle Perception via 3D Part-Guided Visual Data Augmentation [77.60050239225086]
実画像中の車両に動的部品を付加した3次元自動車モデルによる効果的なトレーニングデータ生成プロセスを提案する。私達のアプローチは人間の相互作用なしで完全に自動です。 VUS解析用マルチタスクネットワークとVHI解析用マルチストリームネットワークを提案する。
論文参考訳（メタデータ） (2020-12-15T03:03:38Z)
Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文参考訳（メタデータ） (2020-08-26T16:06:11Z)
Crowdsourced 3D Mapping: A Combined Multi-View Geometry and Self-Supervised Learning Approach [10.610403488989428]
本稿では,意味的意味のあるランドマークの3次元位置を,カメラ固有の知識を仮定せずに推定するフレームワークを提案する。交通標識の位置推定には,多視点幾何と深層学習に基づく自己校正,深度,エゴモーション推定を利用する。我々はそれぞれ39cmと1.26mの平均単方向相対位置と絶対位置の精度を達成した。
論文参考訳（メタデータ） (2020-07-25T12:10:16Z)
Traffic Prediction Framework for OpenStreetMap using Deep Learning based Complex Event Processing and Open Traffic Cameras [4.6453787256723365]
本稿では,トラフィック推定のためのビデオカメラストリームに依存した深層学習に基づく複合イベント処理(CEP)手法を提案する。提案フレームワークは,トラフィックに関連する複数の指標を導出するために,カメラクラスタ間でほぼリアルタイムなオブジェクト検出とオブジェクト特性抽出を行う。このシステムは、ほぼリアルタイムのパフォーマンスが1.42秒、平均Fスコアが0.80である。
論文参考訳（メタデータ） (2020-07-12T17:10:43Z)
Monocular Vision based Crowdsourced 3D Traffic Sign Positioning with Unknown Camera Intrinsics and Distortion Coefficients [11.38332845467423]
カメラの焦点距離,主点,歪み係数を事前に知ることなく,3次元信号位置の計算手法を実証する。我々はそれぞれ0.26mと1.38mの平均的な単行程と絶対的な位置決め精度を達成した。
論文参考訳（メタデータ） (2020-07-09T07:03:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。