論文の概要: Object Tracking and Geo-localization from Street Images
- arxiv url: http://arxiv.org/abs/2107.06257v1
- Date: Tue, 13 Jul 2021 17:32:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 14:46:49.466206
- Title: Object Tracking and Geo-localization from Street Images
- Title(参考訳): 街路画像からの物体追跡とジオローカライゼーション
- Authors: Daniel Wilson, Thayer Alshaabi, Colin Van Oort, Xiaohan Zhang,
Jonathan Nelson, Safwan Wshah
- Abstract要約: 本稿では,低フレームレートのストリートビデオから交通標識を検出・位置情報化するフレームワークを提案する。
提案システムは、カメラに対する各符号の位置オフセットを予測するRetinaNet(GPS-RetinaNet)の修正版を用いている。
提案したデータセットは、幅広い道路から収集された多様な環境群をカバーする。
- 参考スコア(独自算出の注目度): 4.5958644027273685
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geo-localizing static objects from street images is challenging but also very
important for road asset mapping and autonomous driving. In this paper we
present a two-stage framework that detects and geolocalizes traffic signs from
low frame rate street videos. Our proposed system uses a modified version of
RetinaNet (GPS-RetinaNet), which predicts a positional offset for each sign
relative to the camera, in addition to performing the standard classification
and bounding box regression. Candidate sign detections from GPS-RetinaNet are
condensed into geolocalized signs by our custom tracker, which consists of a
learned metric network and a variant of the Hungarian Algorithm. Our metric
network estimates the similarity between pairs of detections, then the
Hungarian Algorithm matches detections across images using the similarity
scores provided by the metric network. Our models were trained using an updated
version of the ARTS dataset, which contains 25,544 images and 47.589 sign
annotations ~\cite{arts}. The proposed dataset covers a diverse set of
environments gathered from a broad selection of roads. Each annotaiton contains
a sign class label, its geospatial location, an assembly label, a side of road
indicator, and unique identifiers that aid in the evaluation. This dataset will
support future progress in the field, and the proposed system demonstrates how
to take advantage of some of the unique characteristics of a realistic
geolocalization dataset.
- Abstract(参考訳): 道路画像からの静的物体のジオローカライズは困難であるが,道路資産マッピングや自動運転においても非常に重要である。
本稿では,低フレームレートストリートビデオから交通標識を検出・位置情報化する2段階フレームワークを提案する。
提案システムでは、標準分類とバウンディングボックス回帰に加えて、カメラに対する各符号の位置オフセットを予測するRetinaNet(GPS-RetinaNet)の修正版を用いている。
GPS-RetinaNetからの候補標識検出は、学習されたメートル法ネットワークとハンガリーアルゴリズムの変種から構成されるカスタムトラッカーにより、ジオローカライズされた標識に凝縮される。
我々のメトリックネットワークは、検出のペア間の類似度を推定し、次いでハンガリーアルゴリズムは、メトリックネットワークが提供する類似度スコアを用いて、画像間で検出をマッチングする。
我々のモデルは、25,544の画像と47.589の署名アノテーション ~\cite{arts}を含むARTSデータセットの更新版を使用してトレーニングされた。
提案されたデータセットは、幅広い道路から集められた多様な環境をカバーする。
各annotaitonには、サインクラスラベル、地理的位置、アセンブリラベル、道路表示器の側面、および評価を支援するユニークな識別子が含まれている。
このデータセットは今後の分野の進歩をサポートし,提案システムでは,現実的なジオローカライゼーションデータセットのユニークな特徴をいかに活用するかを実証する。
関連論文リスト
- Neural Semantic Map-Learning for Autonomous Vehicles [85.8425492858912]
本稿では,道路環境のコヒーレントな地図を作成するために,車両群から収集した局所部分写像を中心インスタンスに融合するマッピングシステムを提案する。
本手法は,シーン特異的なニューラルサイン距離場を用いて,雑音と不完全局所部分写像を併用する。
我々は,記憶効率の高いスパース機能グリッドを活用して大規模にスケールし,シーン再構築における不確実性をモデル化するための信頼スコアを導入する。
論文 参考訳(メタデータ) (2024-10-10T10:10:03Z) - Weakly-supervised Camera Localization by Ground-to-satellite Image Registration [52.54992898069471]
本稿では,地対衛星画像登録のための弱教師付き学習戦略を提案する。
地上画像ごとに正の衛星画像と負の衛星画像を導き出す。
また,クロスビュー画像の相対回転推定のための自己超越戦略を提案する。
論文 参考訳(メタデータ) (2024-09-10T12:57:16Z) - ALINA: Advanced Line Identification and Notation Algorithm [4.12089570007199]
クラウドソーシングのような従来のラベリング手法は、コスト、データのプライバシ、時間、大規模なデータセットの潜在的なエラーのために禁止されている。
本稿では,タクシーウェイデータセットのラベル付けに使用できる新しいアノテーションフレームワークであるAdvanced Line Identification and Notation Algorithm (ALINA)を提案する。
論文 参考訳(メタデータ) (2024-06-13T03:10:22Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - G^3: Geolocation via Guidebook Grounding [92.46774241823562]
本研究では,人間が位置情報に用いている視覚的特徴を記述した人書きガイドブックから,明示的な知識について検討する。
多様な場所からのストリートビュー画像のデータセットを用いたガイドブックグラウンディングによるジオロケーションのタスクを提案する。
提案手法は,Top-1の精度が5%以上向上し,最先端の画像のみの位置決め法よりも大幅に向上する。
論文 参考訳(メタデータ) (2022-11-28T16:34:40Z) - Visual Cross-View Metric Localization with Dense Uncertainty Estimates [11.76638109321532]
本研究は、屋外ロボティクスにおける視覚的クロスビューメトリックローカライゼーションに対処する。
地上レベルのカラー画像と局地的な環境を含む衛星パッチが与えられた場合、衛星パッチ内の地上カメラの位置を特定することが課題である。
我々は、より高密度な衛星記述子、ボトルネックにおける類似性マッチング、およびマルチモーダルなローカライゼーションの曖昧さを捉えるための出力としての密度空間分布を備えた新しいネットワークアーキテクチャを考案した。
論文 参考訳(メタデータ) (2022-08-17T20:12:23Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Continuous Self-Localization on Aerial Images Using Visual and Lidar
Sensors [25.87104194833264]
本研究では,車両のセンサ情報を未確認対象領域の航空画像に登録することにより,屋外環境におけるジオトラッキング手法を提案する。
我々は、地上および空中画像から視覚的特徴を抽出するために、計量学習環境でモデルを訓練する。
本手法は,視認不可能な正光の自己局在化のために,エンド・ツー・エンドの微分可能なモデルでオンボードカメラを利用する最初の方法である。
論文 参考訳(メタデータ) (2022-03-07T12:25:44Z) - AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。
我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文 参考訳(メタデータ) (2022-01-31T20:02:22Z) - Visual and Object Geo-localization: A Comprehensive Survey [11.120155713865918]
ジオローカライゼーション(ジオローカライゼーション)とは、地球上の「ある実体がどこにあるか」を決定する過程のこと。
本稿では、画像の撮影場所(画像ジオローカライゼーション)や画像内の物体の位置決め(オブジェクトジオローカライゼーション)を含む、画像を含む画像の地理的ローカライゼーションに関する包括的調査を行う。
本稿では、一般的なアルゴリズムの要約、提案したデータセットの説明、各分野の現状を説明するためのパフォーマンス結果の分析など、詳細な研究を行う。
論文 参考訳(メタデータ) (2021-12-30T20:46:53Z) - Automatic Signboard Detection and Localization in Densely Populated
Developing Cities [0.0]
自然シーン画像における看板検出は, エラーのない情報検索における最優先課題である。
本稿では,看板を自動的に検出し,そのような都市に適した新しい物体検出手法を提案する。
提案手法では,符号板を正確に検出できる(背景の形状や色が多様であっても平均精度は0.90 mAP)。
論文 参考訳(メタデータ) (2020-03-04T08:04:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。