Fugu-MT 論文翻訳(概要): Parallel Inversion of Neural Radiance Fields for Robust Pose Estimation

論文の概要: Parallel Inversion of Neural Radiance Fields for Robust Pose Estimation

arxiv url: http://arxiv.org/abs/2210.10108v1
Date: Tue, 18 Oct 2022 19:09:58 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-20 15:23:06.334944
Title: Parallel Inversion of Neural Radiance Fields for Robust Pose Estimation
Title（参考訳）: ロバストポーズ推定のためのニューラルラジアンス場の並列インバージョン
Authors: Yunzhi Lin, Thomas M\"uller, Jonathan Tremblay, Bowen Wen, Stephen Tyree, Alex Evans, Patricio A. Vela, Stan Birchfield
Abstract要約: 6-DoFターゲットのポーズを推定するための高速ニューラルネットワーク場(NeRF)に基づく並列最適化手法を提案する。高速NeRFモデルから描画された画素と観測画像中の画素との残差を最小化することにより、カメラの変換と回転を予測できる。実験により,本手法は,合成ベンチマークと実世界のベンチマークの両方において,一般化とロバスト性を向上できることを示した。
参考スコア（独自算出の注目度）: 26.987638406423123
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a parallelized optimization method based on fast Neural Radiance Fields (NeRF) for estimating 6-DoF target poses. Given a single observed RGB image of the target, we can predict the translation and rotation of the camera by minimizing the residual between pixels rendered from a fast NeRF model and pixels in the observed image. We integrate a momentum-based camera extrinsic optimization procedure into Instant Neural Graphics Primitives, a recent exceptionally fast NeRF implementation. By introducing parallel Monte Carlo sampling into the pose estimation task, our method overcomes local minima and improves efficiency in a more extensive search space. We also show the importance of adopting a more robust pixel-based loss function to reduce error. Experiments demonstrate that our method can achieve improved generalization and robustness on both synthetic and real-world benchmarks.
Abstract（参考訳）: 6-DoFターゲットポーズを推定するための高速ニューラルネットワーク場(NeRF)に基づく並列最適化手法を提案する。観測対象の1枚のRGB画像から、高速NeRFモデルから描画された画素と観測画像中の画素との残差を最小化することにより、カメラの変換と回転を予測できる。 Instant Neural Graphics Primitivesには,運動量に基づくカメラの外部最適化手法が組み込まれている。ポーズ推定タスクに並列モンテカルロサンプリングを導入することで,局所的ミニマを克服し,より広範囲な探索空間における効率を向上させる。また,よりロバストな画素ベース損失関数を採用し,誤差を低減することの重要性を示す。実験により,本手法は,合成ベンチマークと実世界のベンチマークの両方において,一般化と堅牢性を向上できることを示した。

関連論文リスト

PixelBoost: Leveraging Brownian Motion for Realistic-Image Super-Resolution [8.041659727964305]
拡散モデルに基づく画像超解像技術は、しばしば現実的な画像生成と計算効率のトレードオフに直面している。我々は,ブラウン運動の性質を受け入れることの重要性を浮き彫りにする新しい拡散モデル PixelBoost を紹介する。提案モデルでは,学習された知覚的イメージパッチ類似度 (LPIPS), 順序誤差 (LOE), ピーク信号-雑音比 (PSNR), 構造的類似度指標 (SSIM) および視覚的品質の観点から,より優れた客観的結果を示す。
論文参考訳（メタデータ） (2025-06-29T14:22:38Z)
Pixel to Gaussian: Ultra-Fast Continuous Super-Resolution with 2D Gaussian Modeling [50.34513854725803]
Arbitrary-scale Super- resolution (ASSR) は、低解像度(LR)入力から任意のアップサンプリング係数で高解像度(HR)イメージを再構成することを目的としている。本稿では,Gaussian Splattingを用いたLR画像から2次元連続HR信号を明示的に再構成する,Pixel-to-Gaussianパラダイムを用いた新しいContinuousSRフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-09T13:43:57Z)
Grayscale to Hyperspectral at Any Resolution Using a Phase-Only Lens [0.0]
我々は、HxWグレースケールのスナップショット測定から、HxWx31ハイパースペクトル像を再構成する問題について検討する。我々は,小さなパッチで動作する条件付き偏差拡散モデルを訓練することにより,限られたデータの利用を効率的に行う。実験の結果,パッチサイズはPSFほど小さく,良好な結果が得られた。
論文参考訳（メタデータ） (2024-12-03T20:00:21Z)
LeRF: Learning Resampling Function for Adaptive and Efficient Image Interpolation [64.34935748707673]
最近のディープニューラルネットワーク(DNN)は、学習データ前処理を導入することで、パフォーマンスを著しく向上させた。本稿では,DNNが学習した構造的前提と局所的連続仮定の両方を活かした学習再サンプリング(Learning Resampling, LeRF)を提案する。 LeRFは空間的に異なる再サンプリング関数を入力画像ピクセルに割り当て、ニューラルネットワークを用いてこれらの再サンプリング関数の形状を予測する。
論文参考訳（メタデータ） (2024-07-13T16:09:45Z)
BID-NeRF: RGB-D image pose estimation with inverted Neural Radiance Fields [0.0]
Inverted Neural Radiance Fields (iNeRF) アルゴリズムの改良を目標とし、画像ポーズ推定問題をNeRFに基づく反復線形最適化として定義する。 NeRFは、現実世界のシーンやオブジェクトのフォトリアリスティックな新しいビューを合成できる新しい空間表現モデルである。
論文参考訳（メタデータ） (2023-10-05T14:27:06Z)
ACDMSR: Accelerated Conditional Diffusion Models for Single Image Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文参考訳（メタデータ） (2023-07-03T06:49:04Z)
NerfingMVS: Guided Optimization of Neural Radiance Fields for Indoor Multi-view Stereo [97.07453889070574]
本稿では,従来のSfM再構成と学習に基づく先行手法を併用した多視点深度推定手法を提案する。提案手法は室内シーンにおける最先端手法を著しく上回ることを示す。
論文参考訳（メタデータ） (2021-09-02T17:54:31Z)
FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文参考訳（メタデータ） (2021-07-07T13:39:08Z)
ROSEFusion: Random Optimization for Online Dense Reconstruction under Fast Camera Motion [15.873973449155313]
RGB-Dシーケンスに基づく再構成は、これまで比較的遅いカメラ動作(1m/s)に抑制されてきた。高速モーションは深度融合に2つの課題をもたらす:1)フレーム間の大きな回転によるカメラポーズ最適化の非線形性、2)動きのぼかしによる確実に追跡可能な特徴の欠如。ランダム最適化による慣性測定がない場合の高速移動カメラ追跡の難しさに対処することを提案する。効率的なテンプレートベースパーティクルセットの進化と効果的なフィットネス機能により,高速カメラ動作(最大4m/s)下での良好な姿勢追跡を実現する。
論文参考訳（メタデータ） (2021-05-12T11:37:34Z)
Robust 360-8PA: Redesigning The Normalized 8-point Algorithm for 360-FoV Images [53.11097060367591]
球面投影における360-fov画像から本質行列を推定する新しい手法を提案する。我々の正規化は、時間を大幅に上回ることなく、カメラの精度を約20%向上させることができることを示す。
論文参考訳（メタデータ） (2021-04-22T07:23:11Z)
Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文参考訳（メタデータ） (2020-12-18T08:25:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。