論文の概要: Domain Generalization for 6D Pose Estimation Through NeRF-based Image Synthesis
- arxiv url: http://arxiv.org/abs/2407.10762v1
- Date: Mon, 15 Jul 2024 14:42:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-16 14:51:56.375323
- Title: Domain Generalization for 6D Pose Estimation Through NeRF-based Image Synthesis
- Title(参考訳): NeRF画像合成による6次元空間推定のための領域一般化
- Authors: Antoine Legrand, Renaud Detry, Christophe De Vleeschouwer,
- Abstract要約: 本研究では,6次元ポーズ推定ネットワークの一般化能力を向上させるために,列車セットの多様性を高める新しい拡張手法を提案する。
この目的のために、ニューラルネットワーク場は合成画像から訓練され、拡張集合を生成するために利用される。
本研究では,宇宙船のポーズ推定の難易度に関する拡張手法を検証するとともに,ポーズ推定の一般化能力を大幅に向上させることを示す。
- 参考スコア(独自算出の注目度): 14.624172952608653
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work introduces a novel augmentation method that increases the diversity of a train set to improve the generalization abilities of a 6D pose estimation network. For this purpose, a Neural Radiance Field is trained from synthetic images and exploited to generate an augmented set. Our method enriches the initial set by enabling the synthesis of images with (i) unseen viewpoints, (ii) rich illumination conditions through appearance extrapolation, and (iii) randomized textures. We validate our augmentation method on the challenging use-case of spacecraft pose estimation and show that it significantly improves the pose estimation generalization capabilities. On the SPEED+ dataset, our method reduces the error on the pose by 50% on both target domains.
- Abstract(参考訳): 本研究では,6次元ポーズ推定ネットワークの一般化能力を向上させるために,列車セットの多様性を高める新しい拡張手法を提案する。
この目的のために、ニューラルネットワーク場は合成画像から訓練され、拡張集合を生成するために利用される。
我々の手法は画像の合成を可能にすることで初期集合を豊かにする。
(i)見当たらない視点
(二 外観外挿による豊かな照明条件、及び
(三)無作為なテクスチャ。
本研究では,宇宙船のポーズ推定の難易度に関する拡張手法を検証するとともに,ポーズ推定の一般化能力を大幅に向上させることを示す。
SPEED+データセットでは、両方の対象領域におけるポーズの誤差を50%削減する。
関連論文リスト
- Domain Generalization for In-Orbit 6D Pose Estimation [14.624172952608653]
宇宙船のポーズ推定ネットワークのための,エンドツーエンドのニューラルベースアーキテクチャを提案する。
提案手法はドメインギャップを効果的に閉鎖し,SPEED+データセット上で最先端の精度を実現する。
論文 参考訳(メタデータ) (2024-06-17T17:01:20Z) - Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation [66.3814684757376]
本研究は,RGB 6Dのカテゴリレベルでのポーズ推定を向上するための拡散モデルに基づく新規ビュー合成器の実用性を示す最初の研究であるZero123-6Dを示す。
本手法は,データ要求の低減,ゼロショットカテゴリレベルの6Dポーズ推定タスクにおける深度情報の必要性の除去,およびCO3Dデータセットの実験により定量的に示された性能の向上を示す。
論文 参考訳(メタデータ) (2024-03-21T10:38:18Z) - JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。
従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。
本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文 参考訳(メタデータ) (2023-12-20T08:05:57Z) - BID-NeRF: RGB-D image pose estimation with inverted Neural Radiance
Fields [0.0]
Inverted Neural Radiance Fields (iNeRF) アルゴリズムの改良を目標とし、画像ポーズ推定問題をNeRFに基づく反復線形最適化として定義する。
NeRFは、現実世界のシーンやオブジェクトのフォトリアリスティックな新しいビューを合成できる新しい空間表現モデルである。
論文 参考訳(メタデータ) (2023-10-05T14:27:06Z) - Pose-Free Neural Radiance Fields via Implicit Pose Regularization [117.648238941948]
IR-NeRFは、暗黙的なポーズ規則化を導入し、ポーズ推定器を非ポーズの実像で精査する革新的なポーズフリー神経放射場である。
特定のシーンの2D画像の収集により、IR-NeRFはシーンの特徴を記憶するシーンコードブックを構築し、シーン固有のポーズ分布を前もって暗黙的にキャプチャする。
論文 参考訳(メタデータ) (2023-08-29T06:14:06Z) - Confronting Ambiguity in 6D Object Pose Estimation via Score-Based Diffusion on SE(3) [9.720777218103052]
単一のRGB画像から6Dオブジェクトのポーズを推定することは大きな課題である。
本稿では,$SE(3)$群に適用した新しいスコアベース拡散法を提案する。
広汎な評価は、その方法があいまいさに対処し、視点によって引き起こされるあいまいさを緩和する効果を示す。
論文 参考訳(メタデータ) (2023-05-25T09:09:32Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - Robust Category-Level 6D Pose Estimation with Coarse-to-Fine Rendering
of Neural Features [17.920305227880245]
1枚のRGB画像からカテゴリレベルの6Dポーズ推定の問題を考察する。
提案手法は,対象カテゴリを立方体メッシュとして表現し,各メッシュにおける神経機能アクティベーションの生成モデルを学習する。
実験では,先行作業と比較して,カテゴリレベルの6次元ポーズ推定性能が向上した。
論文 参考訳(メタデータ) (2022-09-12T21:31:36Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - Enhancement of Novel View Synthesis Using Omnidirectional Image
Completion [61.78187618370681]
ニューラルレイディアンス場(NeRF)に基づく1枚の360度RGB-D画像から新しいビューを合成する方法を提案する。
実験により,提案手法は実世界と実世界の両方でシーンの特徴を保ちながら,可塑性な新規なビューを合成できることが実証された。
論文 参考訳(メタデータ) (2022-03-18T13:49:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。