論文の概要: Light of Normals: Unified Feature Representation for Universal Photometric Stereo
- arxiv url: http://arxiv.org/abs/2506.18882v4
- Date: Sat, 04 Oct 2025 15:23:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 14:28:10.190901
- Title: Light of Normals: Unified Feature Representation for Universal Photometric Stereo
- Title(参考訳): 普通人の光:ユニバーサル測光ステレオのための統一された特徴表現
- Authors: Hong Li, Houyuan Chen, Chongjie Ye, Zhaoxi Chen, Bohan Li, Shaocong Xu, Xianda Guo, Xuhui Liu, Yikai Wang, Baochang Zhang, Satoshi Ikehata, Boxin Shi, Anyi Rao, Hao Zhao,
- Abstract要約: 現在のエンコーダは、照明と通常の情報が切り離されていることを保証できない。
i) 点、方向、環境光を集約する光アライメント監督機能を備えた光レジスタトークン。
また,PS-Verseも導入した。PS-Verseは,幾何学的複雑性と照明の多様性を指標とした大規模合成データセットである。
- 参考スコア(独自算出の注目度): 69.95514862547174
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Universal photometric stereo (PS) is defined by two factors: it must (i) operate under arbitrary, unknown lighting conditions and (ii) avoid reliance on specific illumination models. Despite progress (e.g., SDM UniPS), two challenges remain. First, current encoders cannot guarantee that illumination and normal information are decoupled. To enforce decoupling, we introduce LINO UniPS with two key components: (i) Light Register Tokens with light alignment supervision to aggregate point, direction, and environment lights; (ii) Interleaved Attention Block featuring global cross-image attention that takes all lighting conditions together so the encoder can factor out lighting while retaining normal-related evidence. Second, high-frequency geometric details are easily lost. We address this with (i) a Wavelet-based Dual-branch Architecture and (ii) a Normal-gradient Perception Loss. These techniques yield a unified feature space in which lighting is explicitly represented by register tokens, while normal details are preserved via wavelet branch. We further introduce PS-Verse, a large-scale synthetic dataset graded by geometric complexity and lighting diversity, and adopt curriculum training from simple to complex scenes. Extensive experiments show new state-of-the-art results on public benchmarks (e.g., DiLiGenT, Luces), stronger generalization to real materials, and improved efficiency; ablations confirm that Light Register Tokens + Interleaved Attention Block drive better feature decoupling, while Wavelet-based Dual-branch Architecture + Normal-gradient Perception Loss recover finer details.
- Abstract(参考訳): ユニバーサル測光ステレオ(英: Universal Photometric stereo、PS)は、2つの因子によって定義される。
(i)任意の未知の照明条件下で動作し、
(ii)特定の照明モデルへの依存を避けること。
進歩(SDM UniPSなど)にもかかわらず、2つの課題が残っている。
第一に、現在のエンコーダは照明と通常の情報が切り離されていることを保証できない。
疎結合を強制するために、LINO UniPSと2つの重要なコンポーネントを紹介します。
一 点、方向及び環境灯を集積する配光監督付灯台
2 インターリーブド注意ブロックは、すべての照明条件をまとめて、正常な証拠を保持しつつ、照明を消し去ることができる。
第二に、高周波の幾何学的詳細は容易に失われる。
私たちはこの問題に対処します
(i)ウェーブレットに基づくデュアルブランチアーキテクチャと
(ii)正常段階の知覚喪失。
これらの技術は、ライトがレジスタトークンで明示的に表現されるような統一された特徴空間を生み出し、通常の詳細はウェーブレットブランチを介して保存される。
さらに、PS-Verseは、幾何学的複雑さと照明の多様性によって評価された大規模な合成データセットであり、簡単なシーンから複雑なシーンまで、カリキュラムのトレーニングを取り入れている。
大規模な実験では、公開ベンチマーク(例:DiLiGenT, Luces)における新しい最先端の結果、実際の材料へのより強力な一般化、効率の向上、Light Register Tokens + Interleaved Attention Blockによる機能分離の促進、WaveletベースのDual-branch Architecture + Normal-gradient Perception Lossによる細部の改善などが示されている。
関連論文リスト
- Wavelet-based Decoupling Framework for low-light Stereo Image Enhancement [4.645709745803925]
本稿では,特徴空間デカップリングを用いたウェーブレットを用いた低照度ステレオ画像強調手法を提案する。
ウェーブレット変換を用いて、照明調整のための低周波分岐とテクスチャ強化のための複数の高周波分岐に特徴空間を分解する。
高周波情報を強化するため,クロスアテンション機構に基づくディテール・テクスチャ・エンハンスメント・モジュール(DTEM)を提案する。
論文 参考訳(メタデータ) (2025-07-16T12:42:27Z) - UniRelight: Learning Joint Decomposition and Synthesis for Video Relighting [85.27994475113056]
我々はアルベドを共同で推定し、単一のパスで信頼出力を合成する汎用的アプローチを導入する。
本モデルは,多様な領域にまたがる強力な一般化を示し,視覚的忠実度と時間的整合性の両方において,従来の手法を超越している。
論文 参考訳(メタデータ) (2025-06-18T17:56:45Z) - Towards Scale-Aware Low-Light Enhancement via Structure-Guided Transformer Design [13.587511215001115]
現在の低照度画像強調(LLIE)技術は、ローライト(LL)からノーマルライト(NL)へのマッピングや、セマンティックな特徴や照明マップからのガイダンスに依存している。
SG-LLIEはCNN-Transformerのマルチスケールなハイブリッドフレームワークである。
NTIRE 2025 Low-Light Enhancement Challengeで2位にランクインした。
論文 参考訳(メタデータ) (2025-04-18T20:57:16Z) - Luminance-GS: Adapting 3D Gaussian Splatting to Challenging Lighting Conditions with View-Adaptive Curve Adjustment [46.60106452798745]
3DGSを用いた照明条件下での高品質な新規ビュー合成を実現するための新しいアプローチであるLuminance-GSを紹介する。
ビューごとのカラーマトリクスマッピングとビュー適応曲線調整を採用することで、Luminance-GSは様々な照明条件でSOTA(State-of-the-art)結果を達成する。
以前のNeRFおよび3DGSベースのベースラインと比較して、Luminance-GSは再現性を改善したリアルタイムレンダリング速度を提供する。
論文 参考訳(メタデータ) (2025-04-02T08:54:57Z) - FUSE: Label-Free Image-Event Joint Monocular Depth Estimation via Frequency-Decoupled Alignment and Degradation-Robust Fusion [92.4205087439928]
画像強調共同深度推定法は、頑健な知覚に相補的なモダリティを利用するが、一般化可能性の課題に直面している。
自己監督型転送(PST)と周波数デカップリング型フュージョンモジュール(FreDF)を提案する。
PSTは、画像基盤モデルとの遅延空間アライメントによるクロスモーダルな知識伝達を確立し、データ不足を効果的に軽減する。
FreDFは、低周波構造成分から高周波エッジ特性を明示的に分離し、モード比周波数ミスマッチを解消する。
この組み合わせのアプローチにより、FUSEはターゲットデータセットに対する軽量デコーダ適応のみを必要とするユニバーサルなイメージイベントを構築することができる。
論文 参考訳(メタデータ) (2025-03-25T15:04:53Z) - DLEN: Dual Branch of Transformer for Low-Light Image Enhancement in Dual Domains [0.0]
低照度画像強調(LLE)は、低照度条件下で撮影された画像の視覚的品質を改善することを目的としている。
これらの問題は、物体検出、顔認識、自律運転などのコンピュータビジョンタスクのパフォーマンスを妨げる。
本稿では,2つの異なる注意機構を組み込んだ新しいアーキテクチャであるDual Light Enhance Network(DLEN)を提案する。
論文 参考訳(メタデータ) (2025-01-21T15:58:16Z) - Image Gradient-Aided Photometric Stereo Network [37.71540892622098]
種々の照明下での測光画像からのシェーディング手がかりを用いて表面の正常性を確認するための測光ステレオの開発
最近のディープラーニングベースのPS法は、しばしば物体表面の複雑さを見落としている。
光度と勾配の両方から特徴を抽出するデュアルブランチ・フレームワークである画像勾配支援光度ステレオネットワーク(IGA-PSN)を提案する。
論文 参考訳(メタデータ) (2024-12-16T10:50:52Z) - Adaptive Stereo Depth Estimation with Multi-Spectral Images Across All Lighting Conditions [58.88917836512819]
本稿では,立体深度推定を取り入れた新しいフレームワークを提案し,正確な幾何学的制約を強制する。
照明の劣化がステレオマッチングに与える影響を軽減するために,劣化マスキングを導入する。
提案手法は,Multi-Spectral Stereo(MS2)データセット上でのSOTA(State-of-the-art)性能を実現する。
論文 参考訳(メタデータ) (2024-11-06T03:30:46Z) - Generalizable Non-Line-of-Sight Imaging with Learnable Physical Priors [52.195637608631955]
非視線画像(NLOS)は、その潜在的な応用により注目されている。
既存のNLOS再構成アプローチは、経験的物理的前提に依存して制約される。
本稿では,Learningable Path Compensation(LPC)とAdaptive Phasor Field(APF)の2つの主要な設計を含む,学習に基づく新しいソリューションを提案する。
論文 参考訳(メタデータ) (2024-09-21T04:39:45Z) - Diffusion-based Light Field Synthesis [50.24624071354433]
LFdiffは、LF合成に適した拡散ベースの生成フレームワークである。
本稿では,遠絡型雑音推定ネットワークDistgUnetを提案する。
広範囲な実験により、LFdiffは視覚的に快く、不均一に制御可能な光電場を合成する際に優れていることが示されている。
論文 参考訳(メタデータ) (2024-02-01T13:13:16Z) - VQCNIR: Clearer Night Image Restoration with Vector-Quantized Codebook [16.20461368096512]
夜景撮影は、暗い環境や長時間の露光から生じる、暗い光やぼやけなどの課題に苦しむことが多い。
私たちは、データ駆動の高品質な事前処理の強みを信じ、手動による事前処理の制限を回避するために、信頼性と一貫性のある事前処理の提供に努めています。
VQCNIR(Vector-Quantized Codebook)を用いたClearer Night Image Restorationを提案する。
論文 参考訳(メタデータ) (2023-12-14T02:16:27Z) - Diving into Darkness: A Dual-Modulated Framework for High-Fidelity
Super-Resolution in Ultra-Dark Environments [51.58771256128329]
本稿では,低照度超解像課題の性質を深く理解しようとする,特殊二変調学習フレームワークを提案する。
Illuminance-Semantic Dual Modulation (ISDM) コンポーネントを開発した。
包括的実験は、我々のアプローチが多様で挑戦的な超低照度条件に適用可能であることを示す。
論文 参考訳(メタデータ) (2023-09-11T06:55:32Z) - Self-calibrating Photometric Stereo by Neural Inverse Rendering [88.67603644930466]
本稿では3次元オブジェクト再構成のための非校正光度ステレオの課題に取り組む。
本研究では,物体形状,光方向,光強度を協調的に最適化する手法を提案する。
本手法は,実世界のデータセット上での光推定と形状復元における最先端の精度を示す。
論文 参考訳(メタデータ) (2022-07-16T02:46:15Z) - Structured Light with Redundancy Codes [14.828194821588456]
構造光(SL)システムは能動照明投影による高忠実度3次元形状を得る。
本稿では,ネイティブなSLパターンに加えて,冗長な光信号を投影することで,SLのロバスト性を向上させる手法を提案する。
論文 参考訳(メタデータ) (2022-06-18T16:52:30Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。