Fugu-MT 論文翻訳(概要): I2P-Rec: Recognizing Images on Large-scale Point Cloud Maps through Bird's Eye View Projections

論文の概要: I2P-Rec: Recognizing Images on Large-scale Point Cloud Maps through Bird's Eye View Projections

arxiv url: http://arxiv.org/abs/2303.01043v1
Date: Thu, 2 Mar 2023 07:56:04 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-03 15:34:33.056711
Title: I2P-Rec: Recognizing Images on Large-scale Point Cloud Maps through Bird's Eye View Projections
Title（参考訳）: I2P-Rec:Bird’s Eye View Projectionsによる大規模ポイントクラウドマップの画像認識
Authors: Yixuan Li, Shuhang Zheng, Zhu Yu, Beinan Yu, Si-Yuan Cao, Lun Luo, Hui-Liang Shen
Abstract要約: 位置認識は、完全な自律性を達成するための、自動運転車にとって重要な技術である。クロスモーダルデータを同じモダリティに変換することで,I2P-Rec法を提案する。トレーニングデータの小さなセットだけで、I2P-RecはTop-1で90%以上のリコールレートを達成することができる。
参考スコア（独自算出の注目度）: 20.696503005532406
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Place recognition is an important technique for autonomous cars to achieve full autonomy since it can provide an initial guess to online localization algorithms. Although current methods based on images or point clouds have achieved satisfactory performance, localizing the images on a large-scale point cloud map remains a fairly unexplored problem. This cross-modal matching task is challenging due to the difficulty in extracting consistent descriptors from images and point clouds. In this paper, we propose the I2P-Rec method to solve the problem by transforming the cross-modal data into the same modality. Specifically, we leverage on the recent success of depth estimation networks to recover point clouds from images. We then project the point clouds into Bird's Eye View (BEV) images. Using the BEV image as an intermediate representation, we extract global features with a Convolutional Neural Network followed by a NetVLAD layer to perform matching. We evaluate our method on the KITTI dataset. The experimental results show that, with only a small set of training data, I2P-Rec can achieve a recall rate at Top-1 over 90\%. Also, it can generalize well to unknown environments, achieving recall rates at Top-1\% over 80\% and 90\%, when localizing monocular images and stereo images on point cloud maps, respectively.
Abstract（参考訳）: 位置認識は、オンラインローカライズアルゴリズムに最初の推測を提供するため、自動運転車が完全な自律性を達成するための重要な技術である。画像やポイントクラウドに基づく現在の手法は良好な性能を達成しているが、大規模なポイントクラウドマップ上でのイメージのローカライズは未解決の問題である。このクロスモーダルマッチングタスクは、画像や点雲から一貫した記述子を抽出することが難しいため、難しい。本稿では,クロスモーダルデータを同一モダリティに変換することで,この問題を解決するための i2p-rec 法を提案する。具体的には,近年の深度推定ネットワークの成功を利用して画像から点雲を復元する。次に、ポイント雲をBird's Eye View (BEV)イメージに投影します。中間表現としてBEV画像を用いて、畳み込みニューラルネットワークを用いてグローバルな特徴を抽出し、次いでNetVLAD層を用いてマッチングを行う。提案手法をKITTIデータセット上で評価する。実験の結果, i2p-recのリコールレートは, 僅かなトレーニングデータで90%以上, トップ1で達成できることがわかった。また、ポイントクラウドマップ上のモノクロ画像とステレオ画像をそれぞれローカライズする場合、Top-1\%以上の80\%と90\%のリコール率を達成することで、未知の環境によく当てはまる。

関連論文リスト

Towards Fusing Point Cloud and Visual Representations for Imitation Learning [57.886331184389604]
本稿では,ポイントクラウドとRGBの両特性を効果的に組み合わせた新しい模倣学習手法であるFPV-Netを提案する。適応層ノルム条件付けを用いて,グローバルおよびローカル画像トークン上のポイントクラウドエンコーダを条件付けする。
論文参考訳（メタデータ） (2025-02-17T20:46:54Z)
PointRegGPT: Boosting 3D Point Cloud Registration using Generative Point-Cloud Pairs for Training [90.06520673092702]
生成点クラウドペアを用いた3Dポイントクラウドの登録をトレーニングのために促進するPointRegGPTを提案する。我々の知る限り、これは屋内のクラウド登録のためのリアルなデータ生成を探求する最初の生成的アプローチである。
論文参考訳（メタデータ） (2024-07-19T06:29:57Z)
ModaLink: Unifying Modalities for Efficient Image-to-PointCloud Place Recognition [16.799067323119644]
イメージをエンコードし、クラウドをプレース・ディペンシブ・ディスクリプタに向ける、高速で軽量なフレームワークを紹介します。本研究では,FoV(FoV)変換モジュールを用いて,点雲を画像に類似したモダリティに変換する手法を提案する。また、非負の分解に基づくエンコーダを設計し、点群と画像間の相互に一貫した意味的特徴を抽出する。
論文参考訳（メタデータ） (2024-03-27T17:01:10Z)
HVDistill: Transferring Knowledge from Images to Point Clouds via Unsupervised Hybrid-View Distillation [106.09886920774002]
本稿では,HVDistillと呼ばれるハイブリッドビューに基づく知識蒸留フレームワークを提案する。提案手法は,スクラッチからトレーニングしたベースラインに対して一貫した改善を実現し,既存のスキームを大幅に上回っている。
論文参考訳（メタデータ） (2024-03-18T14:18:08Z)
Point Cloud Pre-training with Diffusion Models [62.12279263217138]
我々は、ポイントクラウド拡散事前学習(PointDif)と呼ばれる新しい事前学習手法を提案する。 PointDifは、分類、セグメンテーション、検出など、さまざまな下流タスクのために、さまざまな現実世界のデータセット間で大幅に改善されている。
論文参考訳（メタデータ） (2023-11-25T08:10:05Z)
CoFiI2P: Coarse-to-Fine Correspondences for Image-to-Point Cloud Registration [9.57539651520755]
CoFiI2Pは、粗い方法で通信を抽出する新しいI2P登録ネットワークである。粗いマッチングフェーズでは、均一なグローバル情報と不均一なグローバル情報の両方をキャプチャするために、新しいI2Pトランスフォーマーモジュールが使用される。微細マッチングモジュールにおいて、スーパーポイント/スーパーピクセル対応のガイダンスにより、ポイント/ピクセル対を確立する。
論文参考訳（メタデータ） (2023-09-26T04:32:38Z)
Object Re-Identification from Point Clouds [3.6308236424346694]
我々は,物体ReIDを点雲から大規模に研究し,画像ReIDに対してその性能を確立する。我々の知る限りでは、我々は実際の雲の観測から物体の再同定を初めて研究している。
論文参考訳（メタデータ） (2023-05-17T13:43:03Z)
Point2Vec for Self-Supervised Representation Learning on Point Clouds [66.53955515020053]
Data2vecをポイントクラウド領域に拡張し、いくつかのダウンストリームタスクで推奨される結果を報告します。我々は、ポイントクラウド上でData2vecライクな事前トレーニングの可能性を解放するpoint2vecを提案する。
論文参考訳（メタデータ） (2023-03-29T10:08:29Z)
BEVPlace: Learning LiDAR-based Place Recognition using Bird's Eye View Images [20.30997801125592]
位置認識における異なる表現の可能性、すなわち鳥の視線(BEV)画像について検討する。 BEV画像上で訓練された単純なVGGNetは、わずかな視点変化のシーンにおける最先端の場所認識手法と同等のパフォーマンスを達成する。そこで我々は,クエリクラウドの位置を推定し,位置認識の利用を拡大する手法を開発した。
論文参考訳（メタデータ） (2023-02-28T05:37:45Z)
SeqNetVLAD vs PointNetVLAD: Image Sequence vs 3D Point Clouds for Day-Night Place Recognition [31.714928102950594]
位置認識は移動ロボットのローカライゼーションとナビゲーションにとって重要な機能である。逐次表現に基づく最近のVPR手法は有望な結果を示した。我々は,3次元点クラウド法と画像シーケンス法を比較した。
論文参考訳（メタデータ） (2021-06-22T02:05:32Z)
DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文参考訳（メタデータ） (2021-04-08T04:27:32Z)
SPU-Net: Self-Supervised Point Cloud Upsampling by Coarse-to-Fine Reconstruction with Self-Projection Optimization [52.20602782690776]
実際のスキャンされたスパースデータからトレーニング用の大規模なペアリングスパーススキャンポイントセットを得るのは高価で面倒です。本研究では,SPU-Net と呼ばれる自己監視型点群アップサンプリングネットワークを提案する。本研究では,合成データと実データの両方について様々な実験を行い,最先端の教師付き手法と同等の性能が得られることを示す。
論文参考訳（メタデータ） (2020-12-08T14:14:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。