論文の概要: CroCo: Cross-Modal Contrastive learning for localization of Earth
Observation data
- arxiv url: http://arxiv.org/abs/2204.07052v1
- Date: Thu, 14 Apr 2022 15:55:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 16:36:50.047346
- Title: CroCo: Cross-Modal Contrastive learning for localization of Earth
Observation data
- Title(参考訳): CroCo:地球観測データの局所化のためのクロスモーダルコントラスト学習
- Authors: Wei-Hsin Tseng, Ho\`ang-\^An L\^e, Alexandre Boulch, S\'ebastien
Lef\`evre, Dirk Tiede
- Abstract要約: 地上のLiDAR点雲をリモートセンシング画像上にローカライズすることに興味がある。
本稿では,DEMと高分解能光学画像に基づいて学習を行うコントラスト学習手法を提案する。
ベストシナリオは、トップ1スコア0.71、トップ5スコア0.81を得る。
- 参考スコア(独自算出の注目度): 62.96337162094726
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: It is of interest to localize a ground-based LiDAR point cloud on remote
sensing imagery. In this work, we tackle a subtask of this problem, i.e. to map
a digital elevation model (DEM) rasterized from aerial LiDAR point cloud on the
aerial imagery. We proposed a contrastive learning-based method that trains on
DEM and high-resolution optical imagery and experiment the framework on
different data sampling strategies and hyperparameters. In the best scenario,
the Top-1 score of 0.71 and Top-5 score of 0.81 are obtained. The proposed
method is promising for feature learning from RGB and DEM for localization and
is potentially applicable to other data sources too. Source code will be
released at https://github.com/wtseng530/AVLocalization.
- Abstract(参考訳): 地上のLiDAR点雲をリモートセンシング画像上にローカライズすることに興味がある。
本研究では,航空画像上のLiDAR点雲から放射されるデジタル標高モデル(DEM)を,この問題のサブタスクに対処する。
我々は,DEMと高分解能光学画像の学習を行う対照的な学習手法を提案し,異なるデータサンプリング戦略とハイパーパラメータのフレームワークを実験した。
ベストシナリオは、トップ1スコア0.71、トップ5スコア0.81を得る。
提案手法は,ローカライズのためのRGBとDEMの機能学習を約束しており,他のデータソースにも適用可能である。
ソースコードはhttps://github.com/wtseng530/AVLocalizationで公開される。
関連論文リスト
- Radio-astronomical Image Reconstruction with Conditional Denoising
Diffusion Model [5.673449249014537]
汚れた電波画像からスカイモデルを再構成することは、高赤方偏移で銀河の進化を研究するために不可欠である。
CLEANやPyBDSFのような現在の技術は、しばしばかすかなソースを検出するのに失敗する。
本研究では、ニューラルネットワークを用いて、汚れた画像から直接スカイモデルを再構築することを提案する。
論文 参考訳(メタデータ) (2024-02-15T18:57:24Z) - Radio Map Estimation -- An Open Dataset with Directive Transmitter
Antennas and Initial Experiments [49.61405888107356]
実世界の現実的な都市地図とオープンなデータソースからの航空画像とともに、シミュレーションされた経路損失無線マップのデータセットをリリースする。
モデルアーキテクチャ,入力特徴設計,航空画像からの無線マップの推定に関する実験を行った。
論文 参考訳(メタデータ) (2024-01-12T14:56:45Z) - Point-SLAM: Dense Neural Point Cloud-based SLAM [61.96492935210654]
本稿では,モノクラーRGBD入力に対する高密度ニューラルネットワークの局所化とマッピング(SLAM)手法を提案する。
トラッキングとマッピングの両方が、同じポイントベースのニューラルシーン表現で実行可能であることを実証する。
論文 参考訳(メタデータ) (2023-04-09T16:48:26Z) - HPointLoc: Point-based Indoor Place Recognition using Synthetic RGB-D
Images [58.720142291102135]
本稿では,屋内環境における視覚的位置認識能力の探索を目的とした,HPointLocという新しいデータセットを提案する。
データセットは人気のあるHabitatシミュレータに基づいており、独自のセンサーデータとオープンデータセットの両方を使用して屋内シーンを生成することができる。
論文 参考訳(メタデータ) (2022-12-30T12:20:56Z) - Refer-it-in-RGBD: A Bottom-up Approach for 3D Visual Grounding in RGBD
Images [69.5662419067878]
RGBD画像における接地参照表現は新たな分野である。
本稿では,参照する物体が閉塞により部分的にスキャンされる場合が多い単視点rgbd画像における3次元視覚グランド化の新たな課題を提案する。
提案手法はまず,RGBD画像内の関連領域をローカライズするヒートマップを生成するために,下層の言語と視覚的特徴を融合させる。
次に、ヒートマップに基づく適応的特徴学習を行い、他のビジオ言語融合とオブジェクトレベルのマッチングを行い、最後に参照したオブジェクトを接地する。
論文 参考訳(メタデータ) (2021-03-14T11:18:50Z) - Rover Relocalization for Mars Sample Return by Virtual Template
Synthesis and Matching [48.0956967976633]
我々は、概念火星サンプルリターンキャンペーンの文脈におけるローバー再局在化の問題を検討する。
このキャンペーンでは、ローバー(R1)は、約50 x 50 mの領域内を自律的にナビゲートおよびローカライズできる必要があります。
本研究では,相対的に不規則な地形に対してロバスト性を示す視覚ローカライザーを提案する。
論文 参考訳(メタデータ) (2021-03-05T00:18:33Z) - RGB2LIDAR: Towards Solving Large-Scale Cross-Modal Visual Localization [20.350871370274238]
我々は,大規模なモーダルな視覚的位置決めの重要かつ未解明な問題について検討する。
我々は550万組のRGBと空中LIDAR深度画像を含む新しいデータセットを導入する。
両モードの外観と意味的手がかりを効果的に組み合わせた新しい結合埋め込み方式を提案する。
論文 参考訳(メタデータ) (2020-09-12T01:18:45Z) - A Nearest Neighbor Network to Extract Digital Terrain Models from 3D
Point Clouds [1.6249267147413524]
本稿では,3Dポイントのクラウド上で動作し,エンド・ツー・エンドのアプローチを用いてシーンの基盤となるDTMを推定するアルゴリズムを提案する。
我々のモデルは近隣情報を学習し、これをポイントワイドでブロックワイドなグローバルな特徴とシームレスに統合する。
論文 参考訳(メタデータ) (2020-05-21T15:54:55Z) - Evaluation of Cross-View Matching to Improve Ground Vehicle Localization
with Aerial Perception [17.349420462716886]
クロスビューマッチング(クロスビューマッチング、cross-view matching)とは、あるクエリーグラウンドビュー画像の最も近いマッチングを、航空画像のデータベースから検索する問題を指す。
本稿では,より長い軌道上での地上車両の位置決め作業に対するクロスビューマッチングの評価を行う。
論文 参考訳(メタデータ) (2020-03-13T23:59:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。