論文の概要: Domain Generalization for 6D Pose Estimation Through NeRF-based Image Synthesis
- arxiv url: http://arxiv.org/abs/2407.10762v1
- Date: Mon, 15 Jul 2024 14:42:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 14:51:56.375323
- Title: Domain Generalization for 6D Pose Estimation Through NeRF-based Image Synthesis
- Title(参考訳): NeRF画像合成による6次元空間推定のための領域一般化
- Authors: Antoine Legrand, Renaud Detry, Christophe De Vleeschouwer,
- Abstract要約: 本研究では,6次元ポーズ推定ネットワークの一般化能力を向上させるために,列車セットの多様性を高める新しい拡張手法を提案する。
この目的のために、ニューラルネットワーク場は合成画像から訓練され、拡張集合を生成するために利用される。
本研究では,宇宙船のポーズ推定の難易度に関する拡張手法を検証するとともに,ポーズ推定の一般化能力を大幅に向上させることを示す。
- 参考スコア(独自算出の注目度): 14.624172952608653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work introduces a novel augmentation method that increases the diversity of a train set to improve the generalization abilities of a 6D pose estimation network. For this purpose, a Neural Radiance Field is trained from synthetic images and exploited to generate an augmented set. Our method enriches the initial set by enabling the synthesis of images with (i) unseen viewpoints, (ii) rich illumination conditions through appearance extrapolation, and (iii) randomized textures. We validate our augmentation method on the challenging use-case of spacecraft pose estimation and show that it significantly improves the pose estimation generalization capabilities. On the SPEED+ dataset, our method reduces the error on the pose by 50% on both target domains.
- Abstract(参考訳): 本研究では,6次元ポーズ推定ネットワークの一般化能力を向上させるために,列車セットの多様性を高める新しい拡張手法を提案する。
この目的のために、ニューラルネットワーク場は合成画像から訓練され、拡張集合を生成するために利用される。
我々の手法は画像の合成を可能にすることで初期集合を豊かにする。
(i)見当たらない視点
(二 外観外挿による豊かな照明条件、及び
(三)無作為なテクスチャ。
本研究では,宇宙船のポーズ推定の難易度に関する拡張手法を検証するとともに,ポーズ推定の一般化能力を大幅に向上させることを示す。
SPEED+データセットでは、両方の対象領域におけるポーズの誤差を50%削減する。
関連論文リスト
- Domain Generalization for In-Orbit 6D Pose Estimation [14.624172952608653]
宇宙船のポーズ推定ネットワークのための,エンドツーエンドのニューラルベースアーキテクチャを提案する。
提案手法はドメインギャップを効果的に閉鎖し,SPEED+データセット上で最先端の精度を実現する。
論文 参考訳(メタデータ) (2024-06-17T17:01:20Z) - Improving Ab-Initio Cryo-EM Reconstruction with Semi-Amortized Pose Inference [30.195615398809043]
2D画像からの非初期3D再構成では、構造に加えてポーズを推定する必要がある。
まずマルチヘッドアーキテクチャをポーズエンコーダとして採用し、画像ごとの複数の可視的なポーズを償却的に推測する。
我々のアプローチは最先端のCryoAIよりも高速で、高解像度の再構築を実現している。
論文 参考訳(メタデータ) (2024-06-15T00:44:32Z) - Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - BID-NeRF: RGB-D image pose estimation with inverted Neural Radiance
Fields [0.0]
Inverted Neural Radiance Fields (iNeRF) アルゴリズムの改良を目標とし、画像ポーズ推定問題をNeRFに基づく反復線形最適化として定義する。
NeRFは、現実世界のシーンやオブジェクトのフォトリアリスティックな新しいビューを合成できる新しい空間表現モデルである。
論文 参考訳(メタデータ) (2023-10-05T14:27:06Z) - Pose-Free Neural Radiance Fields via Implicit Pose Regularization [117.648238941948]
IR-NeRFは、暗黙的なポーズ規則化を導入し、ポーズ推定器を非ポーズの実像で精査する革新的なポーズフリー神経放射場である。
特定のシーンの2D画像の収集により、IR-NeRFはシーンの特徴を記憶するシーンコードブックを構築し、シーン固有のポーズ分布を前もって暗黙的にキャプチャする。
論文 参考訳(メタデータ) (2023-08-29T06:14:06Z) - Confronting Ambiguity in 6D Object Pose Estimation via Score-Based Diffusion on SE(3) [9.720777218103052]
単一のRGB画像から6Dオブジェクトのポーズを推定することは大きな課題である。
本稿では,$SE(3)$群に適用した新しいスコアベース拡散法を提案する。
広汎な評価は、その方法があいまいさに対処し、視点によって引き起こされるあいまいさを緩和する効果を示す。
論文 参考訳(メタデータ) (2023-05-25T09:09:32Z) - TensoIR: Tensorial Inverse Rendering [51.57268311847087]
テンソルIRはテンソル分解とニューラルフィールドに基づく新しい逆レンダリング手法である。
TensoRFは、放射場モデリングのための最先端のアプローチである。
論文 参考訳(メタデータ) (2023-04-24T21:39:13Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - Enhancement of Novel View Synthesis Using Omnidirectional Image
Completion [61.78187618370681]
ニューラルレイディアンス場(NeRF)に基づく1枚の360度RGB-D画像から新しいビューを合成する方法を提案する。
実験により,提案手法は実世界と実世界の両方でシーンの特徴を保ちながら,可塑性な新規なビューを合成できることが実証された。
論文 参考訳(メタデータ) (2022-03-18T13:49:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。