論文の概要: Visual and Object Geo-localization: A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2112.15202v2
- Date: Wed, 11 Oct 2023 18:00:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-15 15:35:58.164460
- Title: Visual and Object Geo-localization: A Comprehensive Survey
- Title(参考訳): ビジュアルおよびオブジェクトのジオローカライゼーション:総合的な調査
- Authors: Daniel Wilson, Xiaohan Zhang, Waqas Sultani, Safwan Wshah
- Abstract要約: ジオローカライゼーション(ジオローカライゼーション)とは、地球上の「ある実体がどこにあるか」を決定する過程のこと。
本稿では、画像の撮影場所(画像ジオローカライゼーション)や画像内の物体の位置決め(オブジェクトジオローカライゼーション)を含む、画像を含む画像の地理的ローカライゼーションに関する包括的調査を行う。
本稿では、一般的なアルゴリズムの要約、提案したデータセットの説明、各分野の現状を説明するためのパフォーマンス結果の分析など、詳細な研究を行う。
- 参考スコア(独自算出の注目度): 11.120155713865918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The concept of geo-localization refers to the process of determining where on
earth some `entity' is located, typically using Global Positioning System (GPS)
coordinates. The entity of interest may be an image, sequence of images, a
video, satellite image, or even objects visible within the image. As massive
datasets of GPS tagged media have rapidly become available due to smartphones
and the internet, and deep learning has risen to enhance the performance
capabilities of machine learning models, the fields of visual and object
geo-localization have emerged due to its significant impact on a wide range of
applications such as augmented reality, robotics, self-driving vehicles, road
maintenance, and 3D reconstruction. This paper provides a comprehensive survey
of geo-localization involving images, which involves either determining from
where an image has been captured (Image geo-localization) or geo-locating
objects within an image (Object geo-localization). We will provide an in-depth
study, including a summary of popular algorithms, a description of proposed
datasets, and an analysis of performance results to illustrate the current
state of each field.
- Abstract(参考訳): ジオローカライゼーション(Geo-localization)とは、地球上の「中心」の位置を決定する過程のことであり、一般的にはGPS座標を用いている。
興味のある実体は、画像、画像のシーケンス、ビデオ、衛星画像、さらには画像内で見えるものであってもよい。
スマートフォンやインターネットによって、GPSタグ付きメディアの膨大なデータセットが急速に利用できるようになるとともに、ディープラーニングが機械学習モデルの性能向上に寄与しているため、拡張現実、ロボティクス、自動運転車、道路整備、そして3D再構築など、幅広いアプリケーションに多大な影響を与えている、視覚的および物体的地理的ローカライゼーションの分野が出現している。
本稿では,画像中の画像の取得場所(画像の局所化)と画像内の物体の局所化(オブジェクトの局所化)のいずれかを決定することにより,画像の局所化に関する総合的な調査を行う。
一般的なアルゴリズムの概要、提案されたデータセットの説明、および各フィールドの現在の状態を説明するためのパフォーマンス結果の分析を含む、詳細な研究を行う。
関連論文リスト
- Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。
エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。
その結果,本手法は現在の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2024-08-21T03:31:30Z) - G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models [40.69217368870192]
我々は、レトリーバル拡張世代(RAG)に基づく世界規模の地理的ローカライゼーションのための新しい枠組みを提案する。
G3は、ジオアライメント、ジオディバーシフィケーション、ジオビジュアライゼーションの3つのステップから構成される。
2つの確立されたデータセットの実験は、他の最先端手法と比較してG3の優位性を検証する。
論文 参考訳(メタデータ) (2024-05-23T15:37:06Z) - GeoCLIP: Clip-Inspired Alignment between Locations and Images for
Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。
既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。
画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文 参考訳(メタデータ) (2023-09-27T20:54:56Z) - GeoGLUE: A GeoGraphic Language Understanding Evaluation Benchmark [56.08664336835741]
我々はGeoGLUEと呼ばれるGeoGraphic Language Understanding Evaluationベンチマークを提案する。
オープンソースの地理資源からデータを収集し、6つの自然言語理解タスクを導入する。
我々は,GeoGLUEベンチマークの有効性と意義を示す一般ベースラインの評価実験と解析を行った。
論文 参考訳(メタデータ) (2023-05-11T03:21:56Z) - G^3: Geolocation via Guidebook Grounding [92.46774241823562]
本研究では,人間が位置情報に用いている視覚的特徴を記述した人書きガイドブックから,明示的な知識について検討する。
多様な場所からのストリートビュー画像のデータセットを用いたガイドブックグラウンディングによるジオロケーションのタスクを提案する。
提案手法は,Top-1の精度が5%以上向上し,最先端の画像のみの位置決め法よりも大幅に向上する。
論文 参考訳(メタデータ) (2022-11-28T16:34:40Z) - A General Purpose Neural Architecture for Geospatial Systems [142.43454584836812]
本稿では,空間的帰納バイアスを持つ汎用ニューラルアーキテクチャ(GPNA)の構築に向けたロードマップを示す。
このようなモデルがコミュニティのメンバー間の協力をいかに促進するかを考察する。
論文 参考訳(メタデータ) (2022-11-04T09:58:57Z) - Accurate 3-DoF Camera Geo-Localization via Ground-to-Satellite Image
Matching [102.39635336450262]
地上で取得したクエリ画像とジオタグ付き衛星画像の大規模データベースとをマッチングすることにより、地上から衛星画像のジオローカライズの問題に対処する。
我々の新しい手法は、衛星画像のピクセルサイズの精度まで、クエリー画像のきめ細かい位置を達成できる。
論文 参考訳(メタデータ) (2022-03-26T20:10:38Z) - Context Aware Object Geotagging [2.4674307340652297]
本研究では,移動構造を用いたストリートビュー画像からの資産配置改善手法を提案する。
OpenStreetMapから抽出した文脈的地理的情報を付与することにより、予測対象の位置情報をさらに洗練する。
論文 参考訳(メタデータ) (2021-08-13T16:16:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。