論文の概要: Variational State-Space Models for Localisation and Dense 3D Mapping in
6 DoF
- arxiv url: http://arxiv.org/abs/2006.10178v3
- Date: Mon, 15 Mar 2021 17:11:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 19:17:06.766819
- Title: Variational State-Space Models for Localisation and Dense 3D Mapping in
6 DoF
- Title(参考訳): 6 dofにおける局所化と密度3次元写像のための変分状態空間モデル
- Authors: Atanas Mirchev, Baris Kayalibay, Patrick van der Smagt and Justin
Bayer
- Abstract要約: 深部状態空間モデルにおける近似ベイズ推定として,空間環境における6-DoFの局所化と3次元密度再構成の問題を解く。
この結果、現在の最先端のビジュアルSLAMソリューションに欠ける、世界の表現力のある予測モデルが生まれる。
我々は、最先端のビジュアル・慣性オドメトリーシステムの性能に近づいた、現実的な無人航空機の飛行データに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 17.698319441265223
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We solve the problem of 6-DoF localisation and 3D dense reconstruction in
spatial environments as approximate Bayesian inference in a deep state-space
model. Our approach leverages both learning and domain knowledge from
multiple-view geometry and rigid-body dynamics. This results in an expressive
predictive model of the world, often missing in current state-of-the-art visual
SLAM solutions. The combination of variational inference, neural networks and a
differentiable raycaster ensures that our model is amenable to end-to-end
gradient-based optimisation. We evaluate our approach on realistic unmanned
aerial vehicle flight data, nearing the performance of state-of-the-art
visual-inertial odometry systems. We demonstrate the applicability of the model
to generative prediction and planning.
- Abstract(参考訳): 深部状態空間モデルにおける近似ベイズ推定として,空間環境における6-DoF局所化と3次元密度再構成の問題を解く。
このアプローチは多視点幾何学と剛体力学から学習とドメイン知識の両方を活用する。
この結果、現在の最先端のビジュアルSLAMソリューションに欠ける、世界の表現力のある予測モデルが生まれる。
変分推論、ニューラルネットワーク、微分可能なレイキャスターの組み合わせにより、われわれのモデルはエンドツーエンドの勾配に基づく最適化に適応できる。
我々は,実写的な無人航空機飛行データに対するアプローチを評価し,最先端の視覚慣性オドメトリシステムの性能に近づいた。
生成予測と計画へのモデルの適用性を実証する。
関連論文リスト
- 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - VortSDF: 3D Modeling with Centroidal Voronoi Tesselation on Signed Distance Field [5.573454319150408]
四面体グリッド上での3次元形状特性を推定するために,明示的なSDFフィールドと浅いカラーネットワークを組み合わせた体積最適化フレームワークを提案する。
Chamfer統計による実験結果は、オブジェクト、オープンシーン、人間などの様々なシナリオにおいて、前例のない復元品質でこのアプローチを検証する。
論文 参考訳(メタデータ) (2024-07-29T09:46:39Z) - Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation [66.3814684757376]
本研究は,RGB 6Dのカテゴリレベルでのポーズ推定を向上するための拡散モデルに基づく新規ビュー合成器の実用性を示す最初の研究であるZero123-6Dを示す。
本手法は,データ要求の低減,ゼロショットカテゴリレベルの6Dポーズ推定タスクにおける深度情報の必要性の除去,およびCO3Dデータセットの実験により定量的に示された性能の向上を示す。
論文 参考訳(メタデータ) (2024-03-21T10:38:18Z) - SeisFusion: Constrained Diffusion Model with Input Guidance for 3D Seismic Data Interpolation and Reconstruction [26.02191880837226]
本研究では3次元地震データに適した新しい拡散モデル再構成フレームワークを提案する。
拡散モデルに3次元ニューラルネットワークアーキテクチャを導入し、2次元拡散モデルを3次元空間に拡張することに成功した。
本手法は、フィールドデータセットと合成データセットの両方に適用した場合、より優れた再構成精度を示す。
論文 参考訳(メタデータ) (2024-03-18T05:10:13Z) - Learned Vertex Descent: A New Direction for 3D Human Model Fitting [64.04726230507258]
画像やスキャンに適合する3次元人体モデルのための新しい最適化手法を提案する。
われわれのアプローチは、非常に異なる体型を持つ服を着た人々の基盤となる身体を捉えることができ、最先端技術と比べて大きな改善を達成できる。
LVDはまた、人間と手の3次元モデル適合にも適用でき、よりシンプルで高速な方法でSOTAに大きな改善が示される。
論文 参考訳(メタデータ) (2022-05-12T17:55:51Z) - Stereo Neural Vernier Caliper [57.187088191829886]
学習に基づくステレオ3Dオブジェクト検出のための新しいオブジェクト中心フレームワークを提案する。
初期3次元立方体推定値から改良された更新を予測する方法の問題に対処する。
提案手法は,KITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T14:36:07Z) - A Model for Multi-View Residual Covariances based on Perspective
Deformation [88.21738020902411]
マルチビューSfM, オードメトリ, SLAMセットアップにおける視覚的残差の共分散モデルの導出を行う。
我々は、合成データと実データを用いてモデルを検証し、それを光度および特徴量に基づくバンドル調整に統合する。
論文 参考訳(メタデータ) (2022-02-01T21:21:56Z) - Tracking and Planning with Spatial World Models [17.698319441265223]
本研究では,異なる世界モデルを用いたリアルタイムナビゲーションとトラッキング手法を提案する。
画像と深度観測のみを用いて15Hzの周波数で最大92%の航法成功率を実現した。
論文 参考訳(メタデータ) (2022-01-25T14:16:46Z) - Extracting Global Dynamics of Loss Landscape in Deep Learning Models [0.0]
本稿では,DOODL3 (Dynamical Organization of Deep Learning Loss Landscapes) のためのツールキットを提案する。
DOODL3は、ニューラルネットワークのトレーニングを動的システムとして定式化し、学習プロセスを分析し、損失ランドスケープにおける軌跡の解釈可能なグローバルビューを示す。
論文 参考訳(メタデータ) (2021-06-14T18:07:05Z) - Iterative Optimisation with an Innovation CNN for Pose Refinement [17.752556490937092]
本研究では,オブジェクトのポーズ推定を改良する手法として,Innovation CNNを提案する。
Innovation CNNを勾配降下フレームワークに反復的に適用することにより、初期ポーズ推定を段階的に改善する。
提案手法は,人気のLINEMODおよびOcclusion LINEMODデータセット上で評価し,両データセットの最先端性能を得る。
論文 参考訳(メタデータ) (2021-01-22T00:12:12Z) - Shape Prior Deformation for Categorical 6D Object Pose and Size
Estimation [62.618227434286]
RGB-D画像から見えないオブジェクトの6Dポーズとサイズを復元する新しい学習手法を提案する。
本研究では,事前学習したカテゴリ形状からの変形を明示的にモデル化することにより,3次元オブジェクトモデルを再構築するディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-07-16T16:45:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。