論文の概要: Coming Down to Earth: Satellite-to-Street View Synthesis for
Geo-Localization
- arxiv url: http://arxiv.org/abs/2103.06818v1
- Date: Thu, 11 Mar 2021 17:40:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 14:43:10.242690
- Title: Coming Down to Earth: Satellite-to-Street View Synthesis for
Geo-Localization
- Title(参考訳): 地球に降りる:衛星からストリートビューへの地殻変動の合成
- Authors: Aysim Toker, Qunjie Zhou, Maxim Maximov and Laura Leal-Taix\'e
- Abstract要約: クロスビュー画像に基づくジオローカライズは,この2つの領域間の視野と外観の違いから,非常に困難である。
衛星入力からリアルなストリートビューを合成することで,この不一致を明示的に解決できることを示す。
本稿では,画像合成と検索を共同で行うマルチタスクアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 9.333087475006003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of cross-view image based geo-localization is to determine the
location of a given street view image by matching it against a collection of
geo-tagged satellite images. This task is notoriously challenging due to the
drastic viewpoint and appearance differences between the two domains. We show
that we can address this discrepancy explicitly by learning to synthesize
realistic street views from satellite inputs. Following this observation, we
propose a novel multi-task architecture in which image synthesis and retrieval
are considered jointly. The rationale behind this is that we can bias our
network to learn latent feature representations that are useful for retrieval
if we utilize them to generate images across the two input domains. To the best
of our knowledge, ours is the first approach that creates realistic street
views from satellite images and localizes the corresponding query street-view
simultaneously in an end-to-end manner. In our experiments, we obtain
state-of-the-art performance on the CVUSA and CVACT benchmarks. Finally, we
show compelling qualitative results for satellite-to-street view synthesis.
- Abstract(参考訳): クロスビュー画像に基づくジオローカライゼーションの目的は、ジオタグ付き衛星画像の集合とマッチングすることで、所定のストリートビュー画像の位置を決定することである。
この課題は、両ドメイン間の劇的な視点と外見の違いから、非常に難しい。
衛星入力からリアルなストリートビューを合成することで,この不一致を明示的に解決できることを示す。
そこで本研究では,画像合成と検索を共同で検討する,新しいマルチタスクアーキテクチャを提案する。
この背景にある根拠は、2つの入力領域にまたがって画像を生成するのに使用すれば、検索に有用な潜在的な特徴表現を学習するためにネットワークをバイアスできるということです。
私たちの知る限りでは、衛星画像から現実的なストリートビューを作成し、対応するクエリストリートビューをエンドツーエンドで同時にローカライズする最初のアプローチです。
本実験では,CVUSAおよびCVACTベンチマークの最先端性能について検討した。
最後に,衛星・ストリートビュー合成の質的な結果を示す。
関連論文リスト
- Sat2Scene: 3D Urban Scene Generation from Satellite Images with
Diffusion [82.97474530980999]
本稿では,3次元スパース表現に拡散モデルを導入し,それらをニューラルレンダリング技術と組み合わせることで,直接3次元シーン生成のための新しいアーキテクチャを提案する。
具体的には、まず3次元拡散モデルを用いて、所定の幾何学の点レベルのテクスチャ色を生成し、次にフィードフォワード方式でシーン表現に変換する。
2つの都市規模データセットを用いた実験により,衛星画像から写真リアルなストリートビュー画像シーケンスとクロスビュー都市シーンを生成する能力を示した。
論文 参考訳(メタデータ) (2024-01-19T16:15:37Z) - Beyond Geo-localization: Fine-grained Orientation of Street-view Images
by Cross-view Matching with Satellite Imagery with Supplementary Materials [29.015865103837413]
クラウドソースされた膨大なストリートビュー画像がインターネットにアップロードされる。
この「使い捨て」状態の隠された宝物を作成するためには、位置情報とカメラ向きの角度が等しく重要な2つのタスクである。
近年, 衛星画像のプールとのクロスビューマッチングにより, ストリートビュー画像のジオローカライズに高い性能を実現している。
本研究では,ストリートビュー画像の微粒な配向を見つけることの重要性を再定義し,問題を正式に定義し,配向推定の品質を評価するための評価指標のセットを提供する。
論文 参考訳(メタデータ) (2023-07-07T05:50:14Z) - Where We Are and What We're Looking At: Query Based Worldwide Image
Geo-localization Using Hierarchies and Scenes [53.53712888703834]
地理的レベルの異なる関係を利用して、エンドツーエンドのトランスフォーマーベースのアーキテクチャを導入する。
4つの標準ジオローカライゼーションデータセット上で,アートストリートレベルの精度を実現する。
論文 参考訳(メタデータ) (2023-03-07T21:47:58Z) - Visual Cross-View Metric Localization with Dense Uncertainty Estimates [11.76638109321532]
本研究は、屋外ロボティクスにおける視覚的クロスビューメトリックローカライゼーションに対処する。
地上レベルのカラー画像と局地的な環境を含む衛星パッチが与えられた場合、衛星パッチ内の地上カメラの位置を特定することが課題である。
我々は、より高密度な衛星記述子、ボトルネックにおける類似性マッチング、およびマルチモーダルなローカライゼーションの曖昧さを捉えるための出力としての密度空間分布を備えた新しいネットワークアーキテクチャを考案した。
論文 参考訳(メタデータ) (2022-08-17T20:12:23Z) - CVLNet: Cross-View Semantic Correspondence Learning for Video-based
Camera Localization [89.69214577915959]
本稿では,クロスビューカメラのローカライゼーション問題に対処する。
本稿では、類似性マッチングの前に、問合せカメラの衛星画像に対する相対変位を推定する。
実験は、単一の画像に基づく位置決めよりもビデオベースの位置決めの有効性を実証した。
論文 参考訳(メタデータ) (2022-08-07T07:35:17Z) - Geo-Localization via Ground-to-Satellite Cross-View Image Retrieval [25.93015219830576]
ランドマークの地平面画像から,衛星視画像の検索により地理空間のクロスビュー化を図っている。
我々は、地上視と衛星視の橋渡しとして、ドローン視情報を利用する。
論文 参考訳(メタデータ) (2022-05-22T17:35:13Z) - Beyond Cross-view Image Retrieval: Highly Accurate Vehicle Localization
Using Satellite Image [91.29546868637911]
本稿では,地上画像と架空衛星地図とをマッチングすることにより,車載カメラのローカライゼーションの問題に対処する。
鍵となる考え方は、タスクをポーズ推定として定式化し、ニューラルネットベースの最適化によってそれを解くことである。
標準自動運転車のローカライゼーションデータセットの実験により,提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2022-04-10T19:16:58Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Geometry-Guided Street-View Panorama Synthesis from Satellite Imagery [80.6282101835164]
オーバヘッド衛星画像から新しいストリートビューパノラマを合成するための新しいアプローチを提案する。
本手法は,googleの全方位ストリートビュー型パノラマを,衛星パッチの中央と同じ地理的位置から取得したかのように生成する。
論文 参考訳(メタデータ) (2021-03-02T10:27:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。