論文の概要: StableNormal: Reducing Diffusion Variance for Stable and Sharp Normal
- arxiv url: http://arxiv.org/abs/2406.16864v1
- Date: Mon, 24 Jun 2024 17:59:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 13:36:22.097307
- Title: StableNormal: Reducing Diffusion Variance for Stable and Sharp Normal
- Title(参考訳): StableNormal: 安定およびシャープ正規化における拡散変動の低減
- Authors: Chongjie Ye, Lingteng Qiu, Xiaodong Gu, Qi Zuo, Yushuang Wu, Zilong Dong, Liefeng Bo, Yuliang Xiu, Xiaoguang Han,
- Abstract要約: この研究は、単色入力による高品質表面正規分布推定の課題に対処する。
我々の方法であるStableNormalは、推論分散を減らして拡散過程の室内性を緩和する。
透明で反射性のある表面に対して頑丈で、多くの物体が散らばっている。
- 参考スコア(独自算出の注目度): 24.867685510826067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work addresses the challenge of high-quality surface normal estimation from monocular colored inputs (i.e., images and videos), a field which has recently been revolutionized by repurposing diffusion priors. However, previous attempts still struggle with stochastic inference, conflicting with the deterministic nature of the Image2Normal task, and costly ensembling step, which slows down the estimation process. Our method, StableNormal, mitigates the stochasticity of the diffusion process by reducing inference variance, thus producing "Stable-and-Sharp" normal estimates without any additional ensembling process. StableNormal works robustly under challenging imaging conditions, such as extreme lighting, blurring, and low quality. It is also robust against transparent and reflective surfaces, as well as cluttered scenes with numerous objects. Specifically, StableNormal employs a coarse-to-fine strategy, which starts with a one-step normal estimator (YOSO) to derive an initial normal guess, that is relatively coarse but reliable, then followed by a semantic-guided refinement process (SG-DRN) that refines the normals to recover geometric details. The effectiveness of StableNormal is demonstrated through competitive performance in standard datasets such as DIODE-indoor, iBims, ScannetV2 and NYUv2, and also in various downstream tasks, such as surface reconstruction and normal enhancement. These results evidence that StableNormal retains both the "stability" and "sharpness" for accurate normal estimation. StableNormal represents a baby attempt to repurpose diffusion priors for deterministic estimation. To democratize this, code and models have been publicly available in hf.co/Stable-X
- Abstract(参考訳): この研究は、単色入力(画像やビデオなど)から高画質表面の正規分布推定を行うという課題に対処する。
しかし、以前の試みは、Image2Normalタスクの決定論的性質と矛盾する確率論的推論と、見積もりプロセスを遅くするコストのかかるステップに依然として苦労している。
提案手法であるStableNormalは, 拡散過程の確率性を緩和し, 推測分散を低減し, 付加的なアンサンブル過程を伴わずに「安定とシャープ」の正規推定を導出する。
StableNormalは、極端な照明、ぼやけ、低品質といった、困難な画像条件下で、堅牢に機能する。
また、透明で反射的な表面に対しても頑丈であり、多くの物体が散らばっている。
具体的には、StableNormalは1ステップの正規推定器(YOSO)から始まり、比較的粗いが信頼性の高い最初の正規推定を導出し、その後、正規を洗練して幾何学的詳細を復元する意味誘導精製プロセス(SG-DRN)を用いる。
StableNormalの有効性は、DIODE-indoor、iBims、ScannetV2、NYUv2といった標準データセットや、表面再構成や正規化といったさまざまな下流タスクの競合パフォーマンスを通じて実証されている。
これらの結果は、StableNormalが正確な正規推定のために「安定性」と「シャープネス」の両方を保っていることを証明している。
StableNormalは、決定論的推定のために拡散先行を再利用しようとする赤ちゃんの試みである。
これを民主化するために、hf.co/Stable-Xでコードとモデルが公開されている。
関連論文リスト
- Error Feedback under $(L_0,L_1)$-Smoothness: Normalization and Momentum [56.37522020675243]
機械学習の幅広い問題にまたがる正規化誤差フィードバックアルゴリズムに対する収束の最初の証明を提供する。
提案手法では,許容可能なステップサイズが大きくなったため,新しい正規化エラーフィードバックアルゴリズムは,各種タスクにおける非正規化エラーよりも優れていた。
論文 参考訳(メタデータ) (2024-10-22T10:19:27Z) - Fine-Tuning Image-Conditional Diffusion Models is Easier than You Think [53.2706196341054]
認識された非効率性は、これまで気付かれなかった推論パイプラインの欠陥によって引き起こされたことを示している。
タスク固有の損失を伴う単一ステップモデル上でエンドツーエンドの微調整を行い、他の拡散に基づく深さモデルや正規推定モデルよりも優れた決定論的モデルを得る。
論文 参考訳(メタデータ) (2024-09-17T16:58:52Z) - ND-SDF: Learning Normal Deflection Fields for High-Fidelity Indoor Reconstruction [50.07671826433922]
微妙な幾何を同時に復元し、異なる特徴を持つ領域をまたいだ滑らかさを保つことは自明ではない。
そこで我々は,ND-SDFを提案する。ND-SDFは,通常のシーンとそれ以前のシーンの角偏差を表す正規偏向場を学習する。
本手法は, 壁面や床面などのスムーズなテクスチャ構造を得るだけでなく, 複雑な構造の幾何学的詳細も保存する。
論文 参考訳(メタデータ) (2024-08-22T17:59:01Z) - GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.78684630040313]
拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文 参考訳(メタデータ) (2024-06-11T17:27:23Z) - Rethinking Inductive Biases for Surface Normal Estimation [26.88363383818789]
本稿では,画素当たりの光線方向を利用して,その相対回転を学習し,隣接する表面の正常値の関係を符号化する。
提案手法は,任意の解像度とアスペクト比の画素内画像に挑戦する際の,クリップかつスムーズな予測を生成できる。
論文 参考訳(メタデータ) (2024-03-01T17:54:37Z) - NeuralGF: Unsupervised Point Normal Estimation by Learning Neural
Gradient Function [55.86697795177619]
3次元点雲の正規推定は3次元幾何処理の基本的な課題である。
我々は,ニューラルネットワークが入力点雲に適合することを奨励する,ニューラルグラデーション関数の学習のための新しいパラダイムを導入する。
広範に使用されているベンチマークの優れた結果から,本手法は非指向性および指向性正常推定タスクにおいて,より正確な正規性を学習できることが示されている。
論文 参考訳(メタデータ) (2023-11-01T09:25:29Z) - Unsupervised Visual Defect Detection with Score-Based Generative Model [17.610722842950555]
我々は、教師なしの視覚的欠陥検出とローカライゼーションタスクに焦点をあてる。
近年のスコアベース生成モデルに基づく新しいフレームワークを提案する。
提案手法を複数のデータセット上で評価し,その有効性を実証する。
論文 参考訳(メタデータ) (2022-11-29T11:06:29Z) - AltUB: Alternating Training Method to Update Base Distribution of
Normalizing Flow for Anomaly Detection [1.3999481573773072]
近年,様々な領域において,教師なし異常検出が注目されている。
その主なアプローチの1つは正規化フローであり、複素分布の像としての可逆変換を N(0, I) として簡単な分布に変換することである。
論文 参考訳(メタデータ) (2022-10-26T16:31:15Z) - NoMorelization: Building Normalizer-Free Models from a Sample's
Perspective [17.027460848621434]
我々は「NoMorelization」と呼ばれる正規化の単純かつ効果的な代替案を提案する。
NoMorelizationは2つのトレーニング可能なスカラーと0中心ノイズインジェクタで構成されている。
既存の主流正規化器と比較して、NoMorelizationは最高速度精度のトレードオフを示している。
論文 参考訳(メタデータ) (2022-10-13T12:04:24Z) - Low-Light Image Enhancement with Normalizing Flow [92.52290821418778]
本稿では,この一対多の関係を正規化フローモデルを用いてモデル化する。
低照度画像/特徴を条件として取り、通常露光される画像の分布をガウス分布にマッピングすることを学ぶ可逆ネットワーク。
既存のベンチマークデータセットによる実験結果から,提案手法はより定量的,質的な結果を得ることができ,照度が良く,ノイズやアーティファクトが小さく,色も豊かになることがわかった。
論文 参考訳(メタデータ) (2021-09-13T12:45:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。