論文の概要: DualMat: PBR Material Estimation via Coherent Dual-Path Diffusion
- arxiv url: http://arxiv.org/abs/2508.05060v1
- Date: Thu, 07 Aug 2025 06:25:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 21:11:55.659184
- Title: DualMat: PBR Material Estimation via Coherent Dual-Path Diffusion
- Title(参考訳): DualMat: Coherent Dual-Path DiffusionによるPBR材料推定
- Authors: Yifeng Huang, Zhang Chen, Yi Xu, Minh Hoai, Zhong Li,
- Abstract要約: 複雑な照明条件下での単一画像からPBR材料を推定するための新しいデュアルパス拡散フレームワークであるDualMatを提案する。
提案手法は,RGB潜伏空間を介して事前学習した視覚的知識を活用するアルベド逆経路と,精密な金属および粗さ推定のために設計されたコンパクト潜伏空間で動作する物質特異的経路という,2つの異なる潜伏空間で動作する。
- 参考スコア(独自算出の注目度): 42.476943434133474
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present DualMat, a novel dual-path diffusion framework for estimating Physically Based Rendering (PBR) materials from single images under complex lighting conditions. Our approach operates in two distinct latent spaces: an albedo-optimized path leveraging pretrained visual knowledge through RGB latent space, and a material-specialized path operating in a compact latent space designed for precise metallic and roughness estimation. To ensure coherent predictions between the albedo-optimized and material-specialized paths, we introduce feature distillation during training. We employ rectified flow to enhance efficiency by reducing inference steps while maintaining quality. Our framework extends to high-resolution and multi-view inputs through patch-based estimation and cross-view attention, enabling seamless integration into image-to-3D pipelines. DualMat achieves state-of-the-art performance on both Objaverse and real-world data, significantly outperforming existing methods with up to 28% improvement in albedo estimation and 39% reduction in metallic-roughness prediction errors.
- Abstract(参考訳): 複雑な照明条件下での単一画像から物理ベースレンダリング(PBR)素材を推定するための新しいデュアルパス拡散フレームワークであるDualMatを提案する。
提案手法は,RGB潜伏空間を介して事前学習した視覚的知識を活用するアルベド最適化経路と,精密な金属および粗さ推定のために設計されたコンパクト潜伏空間で動作する物質特異的経路という,2つの異なる潜伏空間で動作する。
本研究は,アルベド最適化経路と物質特定経路のコヒーレントな予測を確実にするため,訓練中に特徴蒸留を導入する。
品質を維持しつつ、推論ステップを削減し、効率を高めるために修正流を用いる。
我々のフレームワークは、パッチベースの推定とクロスビューアテンションにより、高解像度でマルチビューなインプットまで拡張し、画像から3Dパイプラインへのシームレスな統合を可能にします。
DualMatは、Objaverseデータと実世界のデータの両方で最先端のパフォーマンスを達成し、アルベド推定が最大28%改善し、金属粗さ予測エラーが39%低減された既存の手法よりも大幅に優れています。
関連論文リスト
- Duplex-GS: Proxy-Guided Weighted Blending for Real-Time Order-Independent Gaussian Splatting [37.17972426764452]
本稿では、プロキシガウス表現と順序に依存しないレンダリング技術を統合する二重階層フレームワークを提案する。
我々は、我々のフレームワークとオーダー独立透明性(OIT)をシームレスに組み合わせることで、物理的にインスパイアされた重み付けされた和レンダリング技術を開発し、同時に「ポーピング」と「透明性」アーティファクトを除去する。
提案手法は,既存のOITをベースとしたガウス版よりも1.5~4倍高速で高品質なレンダリングを実現し,ガウス版におけるOITレンダリングの利点を検証した。
論文 参考訳(メタデータ) (2025-08-05T07:44:30Z) - HiNeuS: High-fidelity Neural Surface Mitigating Low-texture and Reflective Ambiguity [8.74691272469226]
HiNeuSは、既存のアプローチにおける3つの中核的な制限に、一貫したフレームワークである。
1) SDF誘導線トレーシングによる微分可視性検証, 2) レイアライン幾何パッチによる平面コンフォーマルな正規化, 3) 局所勾配に基づく幾何的制約を動的に調節する物理的に接地されたアイコン緩和。
論文 参考訳(メタデータ) (2025-06-30T13:45:25Z) - StableGS: A Floater-Free Framework for 3D Gaussian Splatting [9.935869165752283]
3D Gaussian Splatting(3DGS)の復元は、その幾何学的および視覚的忠実さを低下させるスタバボーンフローター(stbborn floater)のアーティファクトに悩まされている。
最終的な外観レンダリングから幾何正規化を分離する新しいフレームワークであるStableGSを提案する。
複数のベンチマークの実験では、StableGSはフローターを除去するだけでなく、一般的なぼやけたアーチファクトのトレードオフも解決している。
論文 参考訳(メタデータ) (2025-03-24T09:02:51Z) - Dual-Level Precision Edges Guided Multi-View Stereo with Accurate Planarization [3.597821311597427]
低テクスチャ領域のマルチビューステレオ (MVS) 再構築が注目されている。
従来のMVSメソッドは、オブジェクト境界と限られた知覚範囲をまたぐような問題にしばしば遭遇する。
平面モデル構築のロバスト性を高めるため、細部および粗部を含む二段精度エッジ情報を導入する。
提案手法は,ETH3D と Tanks & Temples ベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-12-29T02:54:01Z) - SuperMat: Physically Consistent PBR Material Estimation at Interactive Rates [46.21359869741915]
SuperMatは1ステップの推論で高品質な材料分解を実現する1ステップのフレームワークである。
我々は、UVリファインメントネットワークを通じて、我々のフレームワークを3Dオブジェクトに拡張し、視点をまたいだ一貫した物質推定を可能にする。
論文 参考訳(メタデータ) (2024-11-26T15:26:06Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Learning Efficient and Effective Trajectories for Differential Equation-based Image Restoration [59.744840744491945]
本稿では, この手法の軌道最適化を改良し, 復元品質と効率の両立に焦点をあてる。
反復サンプリングに伴うかなりの計算負担を軽減するため,コストを考慮したトラジェクトリー蒸留法を提案する。
提案アルゴリズムを用いて基礎拡散モデル(FLUX)を12Bパラメータで微調整し、7種類の画像復元タスクを処理する統一的なフレームワークを作成する。
論文 参考訳(メタデータ) (2024-10-07T07:46:08Z) - Exploring Latent Cross-Channel Embedding for Accurate 3D Human Pose
Reconstruction in a Diffusion Framework [6.669850111205944]
単眼の3次元ポーズ推定は、2Dから3Dへの再投射過程で生じる固有の深さの曖昧さによって重要な課題を提起する。
拡散モデルの最近の進歩は、再投射のあいまいさに対処するために構造的事前を組み込むことが約束されている。
本稿では,3次元座標の接合レベル特徴と2次元投影との相関関係の解明を目的とした,新しいクロスチャネル埋め込みフレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-18T09:53:03Z) - RadOcc: Learning Cross-Modality Occupancy Knowledge through Rendering
Assisted Distillation [50.35403070279804]
マルチビュー画像を用いた3次元シーンの占有状況とセマンティクスを推定することを目的とした,新たな課題である3D占有予測手法を提案する。
本稿では,RandOccを提案する。Rendering Assisted distillation paradigm for 3D Occupancy prediction。
論文 参考訳(メタデータ) (2023-12-19T03:39:56Z) - NeuSD: Surface Completion with Multi-View Text-to-Image Diffusion [56.98287481620215]
本稿では,対象物の一部のみを捉えた複数の画像から3次元表面再構成を行う手法を提案する。
提案手法は, 表面の可視部分の再構成に神経放射場を用いた表面再構成法と, SDS (Score Distillation Sampling) 方式で事前学習した2次元拡散モデルを用いて, 可観測領域の形状を再現する手法である。
論文 参考訳(メタデータ) (2023-12-07T19:30:55Z) - Light Field Reconstruction via Deep Adaptive Fusion of Hybrid Lenses [67.01164492518481]
本稿では,ハイブリットレンズを用いた高分解能光場(LF)画像の再構成問題について検討する。
本稿では,入力の特徴を包括的に活用できる新しいエンドツーエンド学習手法を提案する。
我々のフレームワークは、高解像度なLFデータ取得のコストを削減し、LFデータストレージと送信の恩恵を受ける可能性がある。
論文 参考訳(メタデータ) (2021-02-14T06:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。