論文の概要: Channel-wise Noise Scheduled Diffusion for Inverse Rendering in Indoor Scenes
- arxiv url: http://arxiv.org/abs/2503.09993v1
- Date: Thu, 13 Mar 2025 03:04:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-14 15:53:09.957110
- Title: Channel-wise Noise Scheduled Diffusion for Inverse Rendering in Indoor Scenes
- Title(参考訳): 屋内シーンにおける逆レンダリングのためのチャネルワイドノイズスケジューリング拡散
- Authors: JunYong Choi, Min-Cheol Sagong, SeokYeong Lee, Seung-Won Jung, Ig-Jae Kim, Junghyun Cho,
- Abstract要約: 逆レンダリングは本質的に不適切であり、単一の正確な解を予測することは困難である。
本稿では,単一のRGB画像を幾何学,材料,照明に分解する拡散ベースの逆レンダリングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 18.42978937263707
- License:
- Abstract: We propose a diffusion-based inverse rendering framework that decomposes a single RGB image into geometry, material, and lighting. Inverse rendering is inherently ill-posed, making it difficult to predict a single accurate solution. To address this challenge, recent generative model-based methods aim to present a range of possible solutions. However, finding a single accurate solution and generating diverse solutions can be conflicting. In this paper, we propose a channel-wise noise scheduling approach that allows a single diffusion model architecture to achieve two conflicting objectives. The resulting two diffusion models, trained with different channel-wise noise schedules, can predict a single highly accurate solution and present multiple possible solutions. The experimental results demonstrate the superiority of our two models in terms of both diversity and accuracy, which translates to enhanced performance in downstream applications such as object insertion and material editing.
- Abstract(参考訳): 本稿では,単一のRGB画像を幾何学,材料,照明に分解する拡散ベースの逆レンダリングフレームワークを提案する。
逆レンダリングは本質的に不適切であり、単一の正確な解を予測することは困難である。
この課題に対処するために、最近の生成モデルに基づく手法は、様々な可能な解決策を提示することを目的としている。
しかし、単一の正確な解を見つけ、多様な解を生成することは矛盾する可能性がある。
本稿では,単一拡散モデルアーキテクチャが相反する2つの目的を達成できるチャネルワイドノイズスケジューリング手法を提案する。
結果として得られた2つの拡散モデルは、異なるチャネルワイドノイズスケジュールで訓練され、単一の高精度な解を予測し、複数の可能な解を提示することができる。
実験の結果,2つのモデルの多様性と精度の両面から,オブジェクト挿入やマテリアル編集といった下流アプリケーションの性能向上を実証した。
関連論文リスト
- Uni-Renderer: Unifying Rendering and Inverse Rendering Via Dual Stream Diffusion [14.779121995147056]
レンダリングと逆レンダリングはコンピュータビジョンとグラフィックスにおいて重要なタスクである。
本稿では、2つの条件生成タスクとしてレンダリングと逆レンダリングを共同でモデル化するデータ駆動手法を提案する。
トレーニングと推論のコードをオープンソースとして公開し、この分野のさらなる研究と開発を後押しします。
論文 参考訳(メタデータ) (2024-12-19T16:57:45Z) - Solving Video Inverse Problems Using Image Diffusion Models [58.464465016269614]
本稿では,画像拡散モデルのみを活用する革新的なビデオ逆解法を提案する。
本手法は,映像の時間次元をバッチ次元画像拡散モデルとして扱う。
また、バッチ間の一貫性を促進するバッチ一貫性サンプリング戦略も導入しています。
論文 参考訳(メタデータ) (2024-09-04T09:48:27Z) - Deep Data Consistency: a Fast and Robust Diffusion Model-based Solver for Inverse Problems [0.0]
本研究では,拡散モデルを用いた逆問題解法において,データ一貫性ステップをディープラーニングモデルで更新するディープデータ一貫性(DDC)を提案する。
線形および非線形タスクにおける最先端手法と比較して、DDCは類似度と実性の両方の指標の優れた性能を示す。
論文 参考訳(メタデータ) (2024-05-17T12:54:43Z) - Denoising Diffusion Bridge Models [54.87947768074036]
拡散モデルは、プロセスを使用してデータにノイズをマッピングする強力な生成モデルである。
画像編集のような多くのアプリケーションでは、モデル入力はランダムノイズではない分布から来る。
本研究では, DDBM(Denoising Diffusion Bridge Models)を提案する。
論文 参考訳(メタデータ) (2023-09-29T03:24:24Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - VideoFusion: Decomposed Diffusion Models for High-Quality Video
Generation [88.49030739715701]
本研究は, フレームごとのノイズを, 全フレーム間で共有されるベースノイズ, 時間軸に沿って変化する残雑音に分解することで, 拡散過程を分解する。
様々なデータセットの実験により,ビデオフュージョンと呼ばれる我々の手法が,高品質なビデオ生成において,GANベースと拡散ベースの両方の選択肢を上回ることが確認された。
論文 参考訳(メタデータ) (2023-03-15T02:16:39Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z) - Dynamic Dual-Output Diffusion Models [100.32273175423146]
反復分解に基づく生成は、他の生成モデルのクラスに匹敵する品質を示すことが示されている。
この方法の大きな欠点は、競合する結果を生み出すために数百のイテレーションが必要であることである。
近年の研究では、より少ないイテレーションでより高速に生成できるソリューションが提案されているが、画像の品質は徐々に低下している。
論文 参考訳(メタデータ) (2022-03-08T11:20:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。