論文の概要: DistillPose: Lightweight Camera Localization Using Auxiliary Learning
- arxiv url: http://arxiv.org/abs/2108.03819v1
- Date: Mon, 9 Aug 2021 05:48:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-11 02:55:20.300606
- Title: DistillPose: Lightweight Camera Localization Using Auxiliary Learning
- Title(参考訳): distillpose: 補助学習による軽量カメラ定位
- Authors: Yehya Abouelnaga, Mai Bui and Slobodan Ilic
- Abstract要約: RGB画像からカメラのポーズを予測するための検索に基づくパイプラインを提案する。
私たちのパイプラインでは、畳み込みニューラルネットワークを使用して、クエリ画像を特徴ベクトルとしてエンコードしています。
- 参考スコア(独自算出の注目度): 23.49208214728748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a lightweight retrieval-based pipeline to predict 6DOF camera
poses from RGB images. Our pipeline uses a convolutional neural network (CNN)
to encode a query image as a feature vector. A nearest neighbor lookup finds
the pose-wise nearest database image. A siamese convolutional neural network
regresses the relative pose from the nearest neighboring database image to the
query image. The relative pose is then applied to the nearest neighboring
absolute pose to obtain the query image's final absolute pose prediction. Our
model is a distilled version of NN-Net that reduces its parameters by 98.87%,
information retrieval feature vector size by 87.5%, and inference time by
89.18% without a significant decrease in localization accuracy.
- Abstract(参考訳): RGB画像から6DOFカメラのポーズを予測するための軽量な検索ベースパイプラインを提案する。
私たちのパイプラインでは、クエリ画像を特徴ベクトルとしてエンコードするために畳み込みニューラルネットワーク(cnn)を使用します。
一番近い隣人のルックアップは、ポーズワイドのデータベースイメージを見つける。
シアム畳み込みニューラルネットワークは、近隣のデータベース画像からクエリ画像への相対的なポーズを後退させる。
次に、近接する絶対ポーズに相対ポーズを適用し、クエリ画像の最終絶対ポーズ予測を得る。
本モデルはnn-netの蒸留版であり, パラメータを98.87%, 情報検索特徴ベクトルサイズを87.5%, 推定時間を89.18%削減した。
関連論文リスト
- No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。
提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。
この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文 参考訳(メタデータ) (2024-10-31T17:58:22Z) - Map-Relative Pose Regression for Visual Re-Localization [20.89982939633994]
本稿では,ポーズ回帰,マップ相対ポーズ回帰 (marepo) に対する新しいアプローチを提案する。
我々は、シーン固有の地図表現に対して、ポーズ予測がシーンマップに対して相対的であるように、ポーズ回帰器を条件とする。
提案手法は,屋内と屋外の2つの公開データセットにおいて,従来のポーズ回帰手法よりはるかに優れている。
論文 参考訳(メタデータ) (2024-04-15T15:53:23Z) - PoseMatcher: One-shot 6D Object Pose Estimation by Deep Feature Matching [51.142988196855484]
本稿では,PoseMatcherを提案する。
3ビューシステムに基づくオブジェクトと画像のマッチングのための新しいトレーニングパイプラインを作成します。
PoseMatcherは、画像とポイントクラウドの異なる入力モダリティに対応できるように、IO-Layerを導入します。
論文 参考訳(メタデータ) (2023-04-03T21:14:59Z) - PoserNet: Refining Relative Camera Poses Exploiting Object Detections [14.611595909419297]
我々は、明示的な意味的オブジェクト検出よりも、ポーズ推定問題を導くために、オブジェクトネス領域を使用する。
本稿では,ペアワイド相対カメラのポーズを近似的に改善する軽量グラフネットワーク Pose Refiner Network (PoserNet) を提案する。
グラフのサイズによって異なる7-Scenesデータセットを評価し、このプロセスが最適化に基づくMotion Averagingアルゴリズムにどのように役立つかを示す。
論文 参考訳(メタデータ) (2022-07-19T17:58:33Z) - BiCo-Net: Regress Globally, Match Locally for Robust 6D Pose Estimation [32.49091033895255]
双方向対応マッピングネットワーク(BiCo-Net)は、典型的なポーズ回帰によって導かれる点雲を生成する。
局所的マッチングと直接ポーズ回帰による冗長なポーズ予測のアンサンブルは、ノイズ観測に対する最終的なポーズ出力をさらに洗練する。
論文 参考訳(メタデータ) (2022-05-07T03:37:33Z) - DeepI2P: Image-to-Point Cloud Registration via Deep Classification [71.3121124994105]
DeepI2Pは、イメージとポイントクラウドの間のクロスモダリティ登録のための新しいアプローチです。
本手法は,カメラとライダーの座標フレーム間の相対的剛性変換を推定する。
登録問題を分類および逆カメラ投影最適化問題に変換することで難易度を回避する。
論文 参考訳(メタデータ) (2021-04-08T04:27:32Z) - Visual Camera Re-Localization Using Graph Neural Networks and Relative
Pose Supervision [31.947525258453584]
視覚再局在化とは、単一の画像を入力として、予め記録された環境に対してカメラの位置と向きを推定する手段である。
提案手法は特別な仮定をほとんど行わず,訓練やテストでは極めて軽量である。
標準の屋内(7-Scenes)と屋外(Cambridge Landmarks)のカメラ再ローカリゼーションベンチマークに対するアプローチの有効性を検証する。
論文 参考訳(メタデータ) (2021-04-06T14:29:03Z) - RePOSE: Real-Time Iterative Rendering and Refinement for 6D Object Pose
Estimation [38.05609071384776]
Iterative pose refinementは、6Dオブジェクトのポーズ推定のための重要な処理ステップである。
CNNベースの画像表現は、ポーズの洗練に使用する計算コストが高い。
レンダリングされたRGB画像から画像特徴を抽出するためにCNNを使う代わりに、より深い特徴画像を直接描画することを提案する。
本手法は6D POSE推定のためのリアルタイム反復レンダリング・リファインメントアルゴリズムであるRePOSEと呼ばれる。
論文 参考訳(メタデータ) (2021-04-01T17:26:54Z) - Back to the Feature: Learning Robust Camera Localization from Pixels to
Pose [114.89389528198738]
画像と3Dモデルから正確な6-DoFのポーズを推定するシーンに依存しないニューラルネットワークPixLocを導入する。
このシステムは、粗いポーズ前の大きな環境でもローカライズできるが、スパース特徴マッチングの精度も向上する。
論文 参考訳(メタデータ) (2021-03-16T17:40:12Z) - Understanding Image Retrieval Re-Ranking: A Graph Neural Network
Perspective [52.96911968968888]
本稿では,GNN(High-parallelism Graph Neural Network)関数として再ランク化が可能であることを示す。
market-1501データセットでは、1k40m gpuで89.2sから9.4msへのリランキング処理を高速化し、リアルタイムのポストプロセッシングを容易にする。
論文 参考訳(メタデータ) (2020-12-14T15:12:36Z) - R-FCN: Object Detection via Region-based Fully Convolutional Networks [87.62557357527861]
我々は,高精度かつ効率的な物体検出のための領域ベースの完全畳み込みネットワークを提案する。
我々の結果は、Faster R-CNNよりも2.5-20倍高速で、1画像あたり170msのテストタイムで達成される。
論文 参考訳(メタデータ) (2016-05-20T15:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。