論文の概要: Deep Probabilistic Feature-metric Tracking
- arxiv url: http://arxiv.org/abs/2008.13504v2
- Date: Wed, 25 Nov 2020 23:47:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 07:27:05.531065
- Title: Deep Probabilistic Feature-metric Tracking
- Title(参考訳): 深部確率的特徴量追跡
- Authors: Binbin Xu, Andrew J. Davison, and Stefan Leutenegger
- Abstract要約: 画素単位の深度特徴写像と深度特徴量不確実性写像を学習するための新しいフレームワークを提案する。
CNNは、より高速で信頼性の高い収束のための深い初期ポーズを予測する。
実験により,TUM RGB-Dデータセットと3次元剛性物体追跡データセットの最先端性能が示された。
- 参考スコア(独自算出の注目度): 27.137827823264942
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dense image alignment from RGB-D images remains a critical issue for
real-world applications, especially under challenging lighting conditions and
in a wide baseline setting. In this paper, we propose a new framework to learn
a pixel-wise deep feature map and a deep feature-metric uncertainty map
predicted by a Convolutional Neural Network (CNN), which together formulate a
deep probabilistic feature-metric residual of the two-view constraint that can
be minimised using Gauss-Newton in a coarse-to-fine optimisation framework.
Furthermore, our network predicts a deep initial pose for faster and more
reliable convergence. The optimisation steps are differentiable and unrolled to
train in an end-to-end fashion. Due to its probabilistic essence, our approach
can easily couple with other residuals, where we show a combination with ICP.
Experimental results demonstrate state-of-the-art performances on the TUM RGB-D
dataset and the 3D rigid object tracking dataset. We further demonstrate our
method's robustness and convergence qualitatively.
- Abstract(参考訳): RGB-D画像からの複雑な画像アライメントは、特に困難な照明条件や幅広いベースライン設定下で、現実世界のアプリケーションにとって重要な問題である。
本稿では,Gauss-Newtonを用いて最小化可能な2次元制約の深い確率的特徴量残差を,粗大な最適化フレームワークで定式化する,畳み込みニューラルネットワーク(CNN)により予測される画素単位の深部特徴量不確実性マップと深部特徴量不確実性マップを学習する新しいフレームワークを提案する。
さらに,ネットワークはより高速で信頼性の高いコンバージェンスに対する深い初期ポーズを予測している。
最適化ステップは微分可能であり、エンドツーエンドでトレーニングするためにアンロールされる。
確率論的性質から,本手法は他の残基と容易に対応でき,ICPと組み合わせることができる。
実験により,TUM RGB-Dデータセットと3次元剛性物体追跡データセットの最先端性能を示す。
さらに,本手法のロバスト性と収束を定性的に示す。
関連論文リスト
- PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion [80.79938369319152]
我々は,PCF(Probabilis-tic Contrastive Fusion)に基づくPCF-Liftという新しいパイプラインを設計する。
私たちのPCFリフトは、ScanNetデータセットやMessy Roomデータセット(シーンレベルのPQが4.4%改善)など、広く使用されているベンチマークにおいて、最先端の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2024-10-14T16:06:59Z) - $ν$-DBA: Neural Implicit Dense Bundle Adjustment Enables Image-Only Driving Scene Reconstruction [31.64067619807023]
$nu$-DBAは、地図パラメトリゼーションのための3次元暗黙曲面を用いた幾何学的密集束調整(DBA)を実装している。
我々は、高密度マッピングの品質をさらに向上するために、シーンごとの自己スーパービジョンで光学フローモデルを微調整する。
論文 参考訳(メタデータ) (2024-04-29T05:29:26Z) - Neural Textured Deformable Meshes for Robust Analysis-by-Synthesis [17.920305227880245]
本稿では, 近似解析を用いた三重視覚タスクを一貫した方法で定式化する。
実世界の画像で評価すると、従来のニューラルネットワークよりも、我々の分析バイシンセシスの方がはるかに堅牢であることが示される。
論文 参考訳(メタデータ) (2023-05-31T18:45:02Z) - Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - A Probabilistic Deep Image Prior for Computational Tomography [0.19573380763700707]
既存の深層学習によるトモグラフィ画像再構成手法では,復元の不確かさの正確な推定は得られない。
我々は,古典的全変動(TV)正規化器と現代の深部画像先行(DIP)を組み合わせたトモグラフィー再構成のためのベイズ事前構築を行う。
提案手法は,高次元設定にスケーラブルな線形化Laplace法に基づく手法である。
論文 参考訳(メタデータ) (2022-02-28T14:47:14Z) - PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。
我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。
提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文 参考訳(メタデータ) (2021-09-28T17:56:41Z) - Riggable 3D Face Reconstruction via In-Network Optimization [58.016067611038046]
本稿では,単眼画像からの3次元顔再構成法を提案する。
表情、ポーズ、照明を含む画像ごとのパーソナライズされた顔リグとパラメータを共同で推定する。
実験により,SOTA復元精度,ロバスト性,一般化能力が得られた。
論文 参考訳(メタデータ) (2021-04-08T03:53:20Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。