論文の概要: Reflection Removal through Efficient Adaptation of Diffusion Transformers
- arxiv url: http://arxiv.org/abs/2512.05000v1
- Date: Thu, 04 Dec 2025 17:12:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.290011
- Title: Reflection Removal through Efficient Adaptation of Diffusion Transformers
- Title(参考訳): 拡散変圧器の高効率適応による反射除去
- Authors: Daniyar Zakarin, Thiemo Wandel, Anton Obukhov, Dengxin Dai,
- Abstract要約: 単像反射除去のための拡散変換器(DiT)フレームワークを提案する。
我々は,既存の反射除去データソースを多様性,拡張性,フォトリアリズムについて分析する。
現実的なガラス材料と反射効果を合成するために,Blenderに物理ベースレンダリングパイプラインを構築した。
- 参考スコア(独自算出の注目度): 30.68558779968187
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We introduce a diffusion-transformer (DiT) framework for single-image reflection removal that leverages the generalization strengths of foundation diffusion models in the restoration setting. Rather than relying on task-specific architectures, we repurpose a pre-trained DiT-based foundation model by conditioning it on reflection-contaminated inputs and guiding it toward clean transmission layers. We systematically analyze existing reflection removal data sources for diversity, scalability, and photorealism. To address the shortage of suitable data, we construct a physically based rendering (PBR) pipeline in Blender, built around the Principled BSDF, to synthesize realistic glass materials and reflection effects. Efficient LoRA-based adaptation of the foundation model, combined with the proposed synthetic data, achieves state-of-the-art performance on in-domain and zero-shot benchmarks. These results demonstrate that pretrained diffusion transformers, when paired with physically grounded data synthesis and efficient adaptation, offer a scalable and high-fidelity solution for reflection removal. Project page: https://hf.co/spaces/huawei-bayerlab/windowseat-reflection-removal-web
- Abstract(参考訳): 本研究では, ファンデーション拡散モデルの一般化強度を利用した単一像反射除去のための拡散変圧器(DiT)フレームワークを提案する。
タスク固有のアーキテクチャに頼るのではなく、リフレクションによって汚染された入力に条件付けし、クリーンな送信層に誘導することで、トレーニング済みのDiTベース基盤モデルを再利用する。
既存のリフレクション除去データソースを,多様性,拡張性,フォトリアリズムのために体系的に解析する。
適切なデータ不足に対処するため,本研究では,現実的なガラス材料と反射効果を合成するために,BSDFを中心に構築された物理ベースレンダリング(PBR)パイプラインをブレンダーに構築する。
基礎モデルの効率的なLoRAに基づく適応と,提案した合成データを組み合わせることで,ドメイン内およびゼロショットベンチマークの最先端性能を実現する。
これらの結果から, 既訓練拡散変圧器と物理基底データ合成と効率的な適応を組み合わせれば, 反射除去のためのスケーラブルで高忠実な解が得られることがわかった。
プロジェクトページ:https://hf.co/spaces/huawei-bayerlab/windowseat-reflection-removal-web
関連論文リスト
- Enhancing Diffusion-based Restoration Models via Difficulty-Adaptive Reinforcement Learning with IQA Reward [93.04811239892852]
強化学習(Reinforcement Learning, RL)は近年, 拡散モデルに組み入れられている。
本稿では,拡散型修復モデルにRLを効果的に組み込む方法について検討する。
論文 参考訳(メタデータ) (2025-11-03T14:57:57Z) - ResPF: Residual Poisson Flow for Efficient and Physically Consistent Sparse-View CT Reconstruction [7.644299873269135]
スパース・ビュー・コンピュート・トモグラフィー(CT)は、放射線線量を減らすための実用的な方法であるが、結果として生じる逆問題により、正確な画像再構成に重大な課題が生じる。
生成モデリングの最近の進歩、特にポアソンフロー生成モデル(PFGM)は、高忠実度画像合成を可能にする。
本稿では, 残余ポアソンフロー(ResPF)生成モデルを提案する。
論文 参考訳(メタデータ) (2025-06-06T01:43:35Z) - NeRF as a Non-Distant Environment Emitter in Physics-based Inverse Rendering [15.876404576998372]
逆レンダリングパイプラインに非距離環境エミッタとしてNeRFを導入する。
我々のNeRFエミッタはシーンライティングをより正確に表現し,逆レンダリングの精度を向上することを示した。
論文 参考訳(メタデータ) (2024-02-07T13:25:16Z) - Frequency Compensated Diffusion Model for Real-scene Dehazing [6.105813272271171]
本研究では,実ヘイズへの一般化を改善する条件付き拡散モデルに基づく脱ヘイズフレームワークについて考察する。
提案手法は, 実世界の画像において, 最先端の手法よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-08-21T06:50:44Z) - Ref-DVGO: Reflection-Aware Direct Voxel Grid Optimization for an
Improved Quality-Efficiency Trade-Off in Reflective Scene Reconstruction [40.90266517194767]
本稿では,再構築の質を高め,トレーニングとレンダリングを高速化するための暗黙的・明示的なアプローチを提案する。
提案手法は, 競合する手法と比較して, 競合する品質効率のトレードオフを実現する。
論文 参考訳(メタデータ) (2023-08-16T17:40:18Z) - Relightify: Relightable 3D Faces from a Single Image via Diffusion
Models [86.3927548091627]
単一画像からの3次元顔BRDF再構成を高精度に行うために,拡散モデルを用いた最初のアプローチを提案する。
既存の手法とは対照的に,観測されたテクスチャを直接入力画像から取得することで,より忠実で一貫した推定が可能となる。
論文 参考訳(メタデータ) (2023-05-10T11:57:49Z) - DIB-R++: Learning to Predict Lighting and Material with a Hybrid
Differentiable Renderer [78.91753256634453]
そこで本研究では,単体画像から固有物体特性を推定する難題について,微分可能量を用いて検討する。
そこで本研究では、スペクトル化とレイトレーシングを組み合わせることで、これらの効果をサポートするハイブリッド微分可能なDIBR++を提案する。
より高度な物理ベースの微分可能値と比較すると、DIBR++はコンパクトで表現力のあるモデルであるため、高い性能を持つ。
論文 参考訳(メタデータ) (2021-10-30T01:59:39Z) - Neural BRDF Representation and Importance Sampling [79.84316447473873]
本稿では,リフレクタンスBRDFデータのコンパクトニューラルネットワークに基づく表現について述べる。
BRDFを軽量ネットワークとしてエンコードし、適応角サンプリングによるトレーニングスキームを提案する。
複数の実世界のデータセットから等方性および異方性BRDFの符号化結果を評価する。
論文 参考訳(メタデータ) (2021-02-11T12:00:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。