Fugu-MT 論文翻訳(概要): Deep Probabilistic Feature-metric Tracking

論文の概要: Deep Probabilistic Feature-metric Tracking

arxiv url: http://arxiv.org/abs/2008.13504v2
Date: Wed, 25 Nov 2020 23:47:16 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-23 07:27:05.531065
Title: Deep Probabilistic Feature-metric Tracking
Title（参考訳）: 深部確率的特徴量追跡
Authors: Binbin Xu, Andrew J. Davison, and Stefan Leutenegger
Abstract要約: 画素単位の深度特徴写像と深度特徴量不確実性写像を学習するための新しいフレームワークを提案する。 CNNは、より高速で信頼性の高い収束のための深い初期ポーズを予測する。実験により,TUM RGB-Dデータセットと3次元剛性物体追跡データセットの最先端性能が示された。
参考スコア（独自算出の注目度）: 27.137827823264942
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Dense image alignment from RGB-D images remains a critical issue for real-world applications, especially under challenging lighting conditions and in a wide baseline setting. In this paper, we propose a new framework to learn a pixel-wise deep feature map and a deep feature-metric uncertainty map predicted by a Convolutional Neural Network (CNN), which together formulate a deep probabilistic feature-metric residual of the two-view constraint that can be minimised using Gauss-Newton in a coarse-to-fine optimisation framework. Furthermore, our network predicts a deep initial pose for faster and more reliable convergence. The optimisation steps are differentiable and unrolled to train in an end-to-end fashion. Due to its probabilistic essence, our approach can easily couple with other residuals, where we show a combination with ICP. Experimental results demonstrate state-of-the-art performances on the TUM RGB-D dataset and the 3D rigid object tracking dataset. We further demonstrate our method's robustness and convergence qualitatively.
Abstract（参考訳）: RGB-D画像からの複雑な画像アライメントは、特に困難な照明条件や幅広いベースライン設定下で、現実世界のアプリケーションにとって重要な問題である。本稿では,Gauss-Newtonを用いて最小化可能な2次元制約の深い確率的特徴量残差を,粗大な最適化フレームワークで定式化する,畳み込みニューラルネットワーク(CNN)により予測される画素単位の深部特徴量不確実性マップと深部特徴量不確実性マップを学習する新しいフレームワークを提案する。さらに,ネットワークはより高速で信頼性の高いコンバージェンスに対する深い初期ポーズを予測している。最適化ステップは微分可能であり、エンドツーエンドでトレーニングするためにアンロールされる。確率論的性質から,本手法は他の残基と容易に対応でき,ICPと組み合わせることができる。実験により,TUM RGB-Dデータセットと3次元剛性物体追跡データセットの最先端性能を示す。さらに,本手法のロバスト性と収束を定性的に示す。

関連論文リスト

JointSplat: Probabilistic Joint Flow-Depth Optimization for Sparse-View Gaussian Splatting [10.690965024885358]
スパースの観点から3Dシーンを再構築することは、幅広いアプリケーションにおいて長年にわたる課題である。近年のフィードフォワード3Dガウスのスパースビュー再構成法は, リアルタイムな新規ビュー合成のための効率的な解法である。光学的流れと深さの相補性を利用する統一的なフレームワークであるJointSplatを提案する。
論文参考訳（メタデータ） (2025-06-04T12:04:40Z)
SplatPose: Geometry-Aware 6-DoF Pose Estimation from Single RGB Image via 3D Gaussian Splatting [3.6688867031495223]
SplatPoseは3次元ガウススティング(3DGS)を2分岐ニューラルアーキテクチャで合成し,高精度なポーズ推定を実現する新しいフレームワークである。 3つのベンチマークデータセットの実験では、SplatPoseが最先端の6-DoFを1つのRGB設定で推定精度で達成していることが示されている。
論文参考訳（メタデータ） (2025-03-07T06:40:06Z)
PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文参考訳（メタデータ） (2024-10-29T15:28:15Z)
PCF-Lift: Panoptic Lifting by Probabilistic Contrastive Fusion [80.79938369319152]
我々は,PCF(Probabilis-tic Contrastive Fusion)に基づくPCF-Liftという新しいパイプラインを設計する。私たちのPCFリフトは、ScanNetデータセットやMessy Roomデータセット(シーンレベルのPQが4.4%改善)など、広く使用されているベンチマークにおいて、最先端の手法よりも大幅に優れています。
論文参考訳（メタデータ） (2024-10-14T16:06:59Z)
$ν$-DBA: Neural Implicit Dense Bundle Adjustment Enables Image-Only Driving Scene Reconstruction [31.64067619807023]
$nu$-DBAは、地図パラメトリゼーションのための3次元暗黙曲面を用いた幾何学的密集束調整(DBA)を実装している。我々は、高密度マッピングの品質をさらに向上するために、シーンごとの自己スーパービジョンで光学フローモデルを微調整する。
論文参考訳（メタデータ） (2024-04-29T05:29:26Z)
Neural Textured Deformable Meshes for Robust Analysis-by-Synthesis [17.920305227880245]
本稿では, 近似解析を用いた三重視覚タスクを一貫した方法で定式化する。実世界の画像で評価すると、従来のニューラルネットワークよりも、我々の分析バイシンセシスの方がはるかに堅牢であることが示される。
論文参考訳（メタデータ） (2023-05-31T18:45:02Z)
Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文参考訳（メタデータ） (2023-03-31T16:01:03Z)
A Probabilistic Deep Image Prior for Computational Tomography [0.19573380763700707]
既存の深層学習によるトモグラフィ画像再構成手法では,復元の不確かさの正確な推定は得られない。我々は,古典的全変動(TV)正規化器と現代の深部画像先行(DIP)を組み合わせたトモグラフィー再構成のためのベイズ事前構築を行う。提案手法は,高次元設定にスケーラブルな線形化Laplace法に基づく手法である。
論文参考訳（メタデータ） (2022-02-28T14:47:14Z)
PDC-Net+: Enhanced Probabilistic Dense Correspondence Network [161.76275845530964]
高度確率密度対応ネットワーク(PDC-Net+)は、精度の高い高密度対応を推定できる。我々は、堅牢で一般化可能な不確実性予測に適したアーキテクチャと強化されたトレーニング戦略を開発する。提案手法は,複数の挑戦的幾何マッチングと光学的フローデータセットに対して,最先端の結果を得る。
論文参考訳（メタデータ） (2021-09-28T17:56:41Z)
Riggable 3D Face Reconstruction via In-Network Optimization [58.016067611038046]
本稿では,単眼画像からの3次元顔再構成法を提案する。表情、ポーズ、照明を含む画像ごとのパーソナライズされた顔リグとパラメータを共同で推定する。実験により,SOTA復元精度,ロバスト性,一般化能力が得られた。
論文参考訳（メタデータ） (2021-04-08T03:53:20Z)
Probabilistic Graph Attention Network with Conditional Kernels for Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。構造化されたマルチスケール機能学習と融合。本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文参考訳（メタデータ） (2021-01-08T04:14:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。