Fugu-MT 論文翻訳(概要): Visual Geo-Localization from images

論文の概要: Visual Geo-Localization from images

arxiv url: http://arxiv.org/abs/2407.14910v1
Date: Sat, 20 Jul 2024 15:47:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-23 20:09:56.898331
Title: Visual Geo-Localization from images
Title（参考訳）: 画像からのビジュアルジオローカライゼーション
Authors: Rania Saoud, Slimane Larabi,
Abstract要約: 本稿では,GPSデータに頼らずに画像から位置の地理的な位置を決定できる視覚的位置情報化システムを提案する。提案手法は, 位置認識のためのスケール不変特徴変換(SIFT), 道路接合型識別のための従来の画像処理, 道路接合の分類のためのVGG16モデルを用いたディープラーニングの3つの主要な手法を統合する。
参考スコア（独自算出の注目度）: 0.5371337604556311
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper presents a visual geo-localization system capable of determining the geographic locations of places (buildings and road intersections) from images without relying on GPS data. Our approach integrates three primary methods: Scale-Invariant Feature Transform (SIFT) for place recognition, traditional image processing for identifying road junction types, and deep learning using the VGG16 model for classifying road junctions. The most effective techniques have been integrated into an offline mobile application, enhancing accessibility for users requiring reliable location information in GPS-denied environments.
Abstract（参考訳）: 本稿では、GPSデータに頼ることなく、画像から場所(建物と道路の交差点)の地理的位置を判断できる視覚的地理的位置決めシステムを提案する。提案手法は, 位置認識のためのスケール不変特徴変換(SIFT), 道路接合型識別のための従来の画像処理, 道路接合の分類のためのVGG16モデルを用いたディープラーニングの3つの主要な手法を統合する。最も効果的な技術はオフラインのモバイルアプリケーションに統合され、GPSで識別された環境において、信頼できる位置情報を必要とするユーザのアクセシビリティが向上した。

関連論文リスト

Street-Level Geolocalization Using Multimodal Large Language Models and Retrieval-Augmented Generation [0.0]
画像からのストリートレベルの地理的ローカライゼーションは、ナビゲーション、位置ベースレコメンデーション、都市計画など、幅広いアプリケーションやサービスにとって不可欠である。本稿では,オープンウェイトおよびパブリックアクセス可能なマルチモーダルな大規模言語モデルと検索強化世代を統合した新しいアプローチを提案する。
論文参考訳（メタデータ） (2025-09-01T10:23:48Z)
VLM-Guided Visual Place Recognition for Planet-Scale Geo-Localization [24.433604332415204]
本稿では,視覚言語モデルと視覚的位置認識の強みを融合した,新しいハイブリッドなジオローカライゼーションフレームワークを提案する。我々は,複数のジオローカライゼーションベンチマークに対するアプローチを評価し,従来手法よりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2025-07-23T12:23:03Z)
Pole-based Vehicle Localization with Vector Maps: A Camera-LiDAR Comparative Study [6.300346102366891]
道路環境では、交通標識、信号機、街灯など多くの一般的な家具がポールの形をしている。本稿では,自動アノテート画像に基づいて訓練された軽量ニューラルネットワークを用いて,カメラによるポール検出をリアルタイムに行う手法を提案する。その結果,オープン道路環境における視線に基づくアプローチの精度が向上した。
論文参考訳（メタデータ） (2024-12-11T09:05:05Z)
Swarm Intelligence in Geo-Localization: A Multi-Agent Large Vision-Language Model Collaborative Framework [51.26566634946208]
smileGeoは、新しい視覚的ジオローカライゼーションフレームワークである。エージェント間のコミュニケーションによって、SmithGeoはこれらのエージェントの固有の知識と、検索された情報を統合する。その結果,本手法は現在の最先端手法よりも優れていた。
論文参考訳（メタデータ） (2024-08-21T03:31:30Z)
G3: An Effective and Adaptive Framework for Worldwide Geolocalization Using Large Multi-Modality Models [40.69217368870192]
我々は、レトリーバル拡張世代(RAG)に基づく世界規模の地理的ローカライゼーションのための新しい枠組みを提案する。 G3は、ジオアライメント、ジオディバーシフィケーション、ジオビジュアライゼーションの3つのステップから構成される。 2つの確立されたデータセットの実験は、他の最先端手法と比較してG3の優位性を検証する。
論文参考訳（メタデータ） (2024-05-23T15:37:06Z)
ConGeo: Robust Cross-view Geo-localization across Ground View Variations [34.192775134189965]
クロスビューなジオローカライゼーションは,地上レベルのクエリイメージを対応するジオレファレンスな空中ビューとマッチングすることで,ローカライズすることを目的としている。既存の学習パイプラインはオリエンテーションに特化しているか、FoVに特化している。本研究では,地形定位のためのコントラスト法であるConGeoを提案する。
論文参考訳（メタデータ） (2024-03-20T20:37:13Z)
GeoCLIP: Clip-Inspired Alignment between Locations and Images for Effective Worldwide Geo-localization [61.10806364001535]
世界規模のジオローカライゼーションは、地球上のどこでも撮影された画像の正確な位置を特定することを目的としている。既存のアプローチは、地球を離散的な地理的細胞に分割し、問題を分類タスクに変換する。画像と対応するGPS位置のアライメントを強制する新しいCLIPにインスパイアされた画像-GPS検索手法であるGeoCLIPを提案する。
論文参考訳（メタデータ） (2023-09-27T20:54:56Z)
Satellite Image Based Cross-view Localization for Autonomous Vehicle [59.72040418584396]
本稿では,市販の高精細衛星画像を使用可能な地図として利用することにより,良好な精度でクロスビュー車両のローカライゼーションを実現することができることを示す。本手法はKITTIとFord Multi-AVの季節データセットを地上ビューとして,Google Mapsを衛星ビューとして検証した。
論文参考訳（メタデータ） (2022-07-27T13:16:39Z)
Co-visual pattern augmented generative transformer learning for automobile geo-localization [12.449657263683337]
クロスビュージオローカライゼーション(CVGL)は、地上カメラの地理的位置を、巨大なジオタグ付き空中画像とマッチングすることによって推定することを目的としている。 CVGLのための相互生成型トランスフォーマー学習(MGTL)という,トランスフォーマーと組み合わせたクロスビュー知識生成技術を用いた新しい手法を提案する。
論文参考訳（メタデータ） (2022-03-17T07:29:02Z)
Continuous Self-Localization on Aerial Images Using Visual and Lidar Sensors [25.87104194833264]
本研究では,車両のセンサ情報を未確認対象領域の航空画像に登録することにより,屋外環境におけるジオトラッキング手法を提案する。我々は、地上および空中画像から視覚的特徴を抽出するために、計量学習環境でモデルを訓練する。本手法は,視認不可能な正光の自己局在化のために,エンド・ツー・エンドの微分可能なモデルでオンボードカメラを利用する最初の方法である。
論文参考訳（メタデータ） (2022-03-07T12:25:44Z)
Visual and Object Geo-localization: A Comprehensive Survey [11.120155713865918]
ジオローカライゼーション(ジオローカライゼーション)とは、地球上の「ある実体がどこにあるか」を決定する過程のこと。本稿では、画像の撮影場所(画像ジオローカライゼーション)や画像内の物体の位置決め(オブジェクトジオローカライゼーション)を含む、画像を含む画像の地理的ローカライゼーションに関する包括的調査を行う。本稿では、一般的なアルゴリズムの要約、提案したデータセットの説明、各分野の現状を説明するためのパフォーマンス結果の分析など、詳細な研究を行う。
論文参考訳（メタデータ） (2021-12-30T20:46:53Z)
Semantic Image Alignment for Vehicle Localization [111.59616433224662]
単眼カメラからのセマンティックセグメンテーションを用いた高密度セマンティックマップにおける車両位置推定手法を提案する。既存の視覚的ローカライゼーションアプローチとは対照的に、システムは追加のキーポイント機能、手作りのローカライゼーションランドマーク抽出器、高価なLiDARセンサーを必要としない。
論文参考訳（メタデータ） (2021-10-08T14:40:15Z)
GANav: Group-wise Attention Network for Classifying Navigable Regions in Unstructured Outdoor Environments [54.21959527308051]
本稿では,RGB画像から,オフロード地形および非構造環境における安全かつ航行可能な領域を識別する新しい学習手法を提案する。本手法は,粒度の粗いセマンティックセグメンテーションを用いて,そのナビビリティレベルに基づいて地形分類群を分類する。 RUGD と RELLIS-3D のデータセットを広範囲に評価することにより,我々の学習アルゴリズムがナビゲーションのためのオフロード地形における視覚知覚の精度を向上させることを示す。
論文参考訳（メタデータ） (2021-03-07T02:16:24Z)
Each Part Matters: Local Patterns Facilitate Cross-view Geo-localization [54.00111565818903]
クロスビューなジオローカライゼーションは、異なるプラットフォームから同じ地理的ターゲットの画像を見つけることである。既存の手法は通常、画像センター内の地理的ターゲットの微細な特徴をマイニングすることに集中している。我々は、文脈情報を活用するために、ローカルパターンネットワーク(LPN)と呼ばれるシンプルで効果的なディープニューラルネットワークを導入する。
論文参考訳（メタデータ） (2020-08-26T16:06:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。