論文の概要: Poppy: Polarization-based Plug-and-Play Guidance for Enhancing Monocular Normal Estimation
- arxiv url: http://arxiv.org/abs/2603.27891v1
- Date: Sun, 29 Mar 2026 22:05:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.160856
- Title: Poppy: Polarization-based Plug-and-Play Guidance for Enhancing Monocular Normal Estimation
- Title(参考訳): Poppy: 偏光型単眼正規化のためのプラグアンドプレイガイダンス
- Authors: Irene Kim, Sai Tanmay Reddy Chakkera, Alexandros Graikos, Dimitris Samaras, Akshat Dave,
- Abstract要約: Poppyは、テスト時に単発偏光測定を使用して、凍結したRGBバックボーンから正規性を洗練する、トレーニング不要のフレームワークである。
微分可能なレンダリング層は、精製された正規項を偏光予測に変換し、観察された信号とミスマッチをペナライズする。
これらの結果から, 学習したRGBに基づく偏極キューを用いた正規分布推定器の誘導は, 再学習することなく, 挑戦面上の正規分布を洗練させることがわかった。
- 参考スコア(独自算出の注目度): 69.74622862203036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Monocular surface normal estimators trained on large-scale RGB-normal data often perform poorly in the edge cases of reflective, textureless, and dark surfaces. Polarization encodes surface orientation independently of texture and albedo, offering a physics-based complement for these cases. Existing polarization methods, however, require multi-view capture or specialized training data, limiting generalization. We introduce Poppy, a training-free framework that refines normals from any frozen RGB backbone using single-shot polarization measurements at test time. Keeping backbone weights frozen, Poppy optimizes per-pixel offsets to the input RGB and output normal along with a learned reflectance decomposition. A differentiable rendering layer converts the refined normals into polarization predictions and penalizes mismatches with the observed signal. Across seven benchmarks and three backbone architectures (diffusion, flow, and feed-forward), Poppy reduces mean angular error by 23-26% on synthetic data and 6-16% on real data. These results show that guiding learned RGB-based normal estimators with polarization cues at test time refines normals on challenging surfaces without retraining.
- Abstract(参考訳): 大規模RGB正規データに基づいて訓練された単眼表面正規分布推定器は、反射面、無テクスチャ面、暗黒面のエッジケースでは性能が良くない。
偏光はテクスチャとアルベドとは独立に表面配向を符号化し、これらの場合の物理ベースの補体を提供する。
しかし、既存の分極法では、多視点キャプチャや特別な訓練データが必要であり、一般化を制限している。
テスト時に単発偏光測定を用いて冷凍RGBバックボーンから正規性を洗練する,トレーニングフリーのフレームワークであるPoppyを紹介した。
バックボーンの重みを凍結し続けるため、Poppyは入力されたRGBに画素当たりのオフセットを最適化し、学習された反射率分解とともに正常に出力する。
微分可能なレンダリング層は、精製された正規項を偏光予測に変換し、観察された信号とミスマッチをペナライズする。
7つのベンチマークと3つのバックボーンアーキテクチャ(拡散、フロー、フィードフォワード)でPoppyは、合成データの平均角誤差を23~26%減らし、実際のデータでは6~16%減らした。
これらの結果から, 学習したRGBに基づく偏極キューを用いた正規分布推定器の誘導は, 再学習することなく, 挑戦面上の正規分布を洗練させることがわかった。
関連論文リスト
- Revisiting Shape from Polarization in the Era of Vision Foundation Models [11.779432473091754]
小さいデータセットでトレーニングされた軽量モデルは、単発物体表面の正常推定において、RGBのみの視覚基盤モデル(VFM)より優れていることを示す。
40Kのトレーニングシーンで,本手法は最先端のSfPアプローチとRGBのみのVFMの両方に優れていた。
論文 参考訳(メタデータ) (2026-03-05T05:07:03Z) - Shape from Polarization of Thermal Emission and Reflection [2.7317088388886384]
長波長赤外(LWIR)スペクトルにおける偏光の形状(SfP)技術を利用する。
我々は、放射と反射の複合効果を明示的に考慮した偏極モデルを定式化した。
我々はプロトタイプシステムを実装し、LWIR SfPのための最初の実世界のベンチマークデータセットであるThermoPolを開発した。
論文 参考訳(メタデータ) (2025-06-23T00:33:17Z) - Glossy Object Reconstruction with Cost-effective Polarized Acquisition [41.96986483856648]
この研究は、コスト効率の良い取得ツールを使用するスケーラブルな分極支援アプローチを導入している。
提案手法は,物体表面の分極的BRDF,ストークスベクトル,偏光状態をニューラル暗黙的場として表現する。
偏光レンダリングの暗黙的な表現に基本的な物理原理を活用することにより,本手法は既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-09T16:38:51Z) - SS-SfP:Neural Inverse Rendering for Self Supervised Shape from (Mixed) Polarization [21.377923666134116]
偏光の形状 (SfP) は偏光の形状 (SfP) として知られる問題である。
単視点偏光画像から物体やシーンの3次元形状(画素表面の正規度と深さ)を推定する逆レンダリングに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-12T14:29:00Z) - Polarization Wavefront Lidar: Learning Large Scene Reconstruction from Polarized Wavefronts [46.79906673307029]
我々は、放射光と受信光の偏光を変調する新しい長距離偏光波面センサ(PolLidar)を導入する。
我々は、新しい学習的再構成手法を用いて、屋外シナリオにおける正常、距離、材料特性を推定するために偏波波面を利用する。
論文 参考訳(メタデータ) (2024-06-05T17:09:51Z) - Ternary-Type Opacity and Hybrid Odometry for RGB NeRF-SLAM [58.736472371951955]
表面を交差する光線上の点を3つの領域(前・前・後・後)に分類する3成分式不透明度モデルを導入する。
これにより、より正確な深度のレンダリングが可能となり、画像ワープ技術の性能が向上する。
TTとHOの統合アプローチは,合成および実世界のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-20T18:03:17Z) - Shape from Polarization for Complex Scenes in the Wild [93.65746187211958]
単一偏光画像からシーンレベルの正規推定を行うために,物理量に基づく新しいデータ駆動手法を提案する。
実世界のシーンレベルのSfPデータセットに、ペア化された入力偏光画像と接地トラス正規地図をコントリビュートする。
我々の訓練されたモデルは、偏光と表面の正常値の関係が距離に影響されないため、遠距離場屋外シーンに一般化することができる。
論文 参考訳(メタデータ) (2021-12-21T17:30:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。