論文の概要: HAD: Hallucination-Aware Diffusion Priors for 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2605.16873v1
- Date: Sat, 16 May 2026 08:31:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.211233
- Title: HAD: Hallucination-Aware Diffusion Priors for 3D Reconstruction
- Title(参考訳): 3次元再構成に先立つ幻覚の拡散
- Authors: Xi Liu, Weiwei Sun, Zhou Ren, Chris Broaddus, Siyu Huang, Laurent Guigues,
- Abstract要約: 強調画像に対する幻覚-認識拡散事前推定ピクセルワイド幻覚スコアマップ
これらの幻覚スコアは、プログレッシブ3D再構成過程において、信頼できない画素の選択的マスキングを可能にする。
本手法は,拡散支援3次元再構成における幻覚アーティファクトを著しく低減することを示す。
- 参考スコア(独自算出の注目度): 17.06830617282413
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Diffusion priors have recently demonstrated strong capability in enhancing the quality of sparse-view 3D reconstruction by augmenting training views at novel viewpoints, but they inevitably introduce hallucinated content -- artifacts inconsistent with the input views -- into the final 3D model. To address this challenge, we propose Hallucination-Aware Diffusion prior (HAD), which estimates pixel-wise hallucination score maps for augmented images by leveraging multi-view reasoning capabilities from a feedforward novel view synthesis (NVS) network pre-trained on large-scale 3D data. These hallucination scores enable selective masking of unreliable pixels during the progressive 3D reconstruction procedure, preventing the introduction of non-existent artifacts into the 3D model. To further enhance performance, we create multiple versions of augmented images at each novel view by conditioning the diffusion prior on different input views, which are then fused into a final image that leverages the broader context across all input views. We show that our method substantially reduces hallucination artifacts in diffusion-assisted 3D reconstruction, thereby achieving state-of-the-art performance across multiple benchmarks on novel view synthesis. Our project are publicly available at \href{https://xiliu8006.github.io/HAD-Project-website/}{project website}.
- Abstract(参考訳): 拡散先行者は近年,新しい視点でのトレーニングビューを増強することで,スパースビューの3D再構築の質を高める強力な能力を示したが,必然的に幻覚コンテンツ(入力ビューと矛盾するアーティファクト)を最終3Dモデルに導入した。
この課題に対処するために,大規模な3Dデータに基づいて事前学習したフィードフォワード・ノウハウ・ビュー・シンセシス(NVS)ネットワークから多視点推論機能を活用することで,拡張画像に対する画素単位の幻覚スコアマップを推定するHalucination-Aware Diffusion prior (HAD)を提案する。
これらの幻覚スコアは、プログレッシブ3D再構成過程において、信頼できない画素の選択的マスキングを可能にし、3Dモデルに存在しないアーティファクトの導入を防止する。
性能をさらに向上させるために、異なる入力ビューに先行して拡散を条件付けることで、各新規ビューで複数の拡張イメージを作成し、その後、全ての入力ビューにまたがる広いコンテキストを活用する最終イメージに融合する。
本研究では,拡散支援3次元再構成における幻覚アーティファクトを著しく低減し,新規なビュー合成における複数のベンチマークで最先端の性能を実現することを示す。
私たちのプロジェクトは、 \href{https://xiliu8006.github.io/HAD-Project-website/}{project website}で公開されています。
関連論文リスト
- GenFusion: Closing the Loop between Reconstruction and Generation via Videos [24.195304481751602]
本稿では,再現性のあるRGB-Dレンダリングにおける映像フレームの条件付けを学習する再構成駆動型ビデオ拡散モデルを提案する。
また、生成モデルからトレーニングセットへの復元フレームを反復的に追加する循環核融合パイプラインを提案する。
論文 参考訳(メタデータ) (2025-03-27T07:16:24Z) - Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models [65.90387371072413]
本稿では,3次元再構成と新規ビュー合成を向上する新しいパイプラインであるDifix3D+を紹介する。
このアプローチのコアとなるのは、レンダリングされた新規ビューにおけるアーティファクトの強化と削除のためにトレーニングされた、単一ステップのイメージ拡散モデルであるDifixです。
論文 参考訳(メタデータ) (2025-03-03T17:58:33Z) - GAF: Gaussian Avatar Reconstruction from Monocular Videos via Multi-view Diffusion [5.49003371165534]
記録からの光リアルな3D頭部アバター再構成は、観測が限られているため困難である。
複数視点の頭部拡散モデルを導入し,その先行特性を利用して,欠落した領域を埋め,視界の整合性を確保する。
提案手法をNeRSembleデータセット上で評価し,新しいビュー合成における従来の最先端手法よりも優れていたことを示す。
論文 参考訳(メタデータ) (2024-12-13T15:31:22Z) - The More You See in 2D, the More You Perceive in 3D [32.578628729549145]
SAP3Dは、任意の数の未提示画像から3D再構成と新しいビュー合成を行うシステムである。
入力画像の数が増えるにつれて,提案手法の性能が向上することを示す。
論文 参考訳(メタデータ) (2024-04-04T17:59:40Z) - Denoising Diffusion via Image-Based Rendering [54.20828696348574]
実世界の3Dシーンの高速かつ詳細な再構築と生成を可能にする最初の拡散モデルを提案する。
まず、大きな3Dシーンを効率よく正確に表現できる新しいニューラルシーン表現であるIBプレーンを導入する。
第二に,2次元画像のみを用いて,この新たな3次元シーン表現の事前学習を行うためのデノイング拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-05T19:00:45Z) - Sparse3D: Distilling Multiview-Consistent Diffusion for Object
Reconstruction from Sparse Views [47.215089338101066]
スパースビュー入力に適した新しい3D再構成手法であるスパース3Dを提案する。
提案手法は,多視点拡散モデルから頑健な先行情報を抽出し,ニューラルラディアンス場を改良する。
強力な画像拡散モデルから2Dプリエントをタップすることで、我々の統合モデルは、常に高品質な結果をもたらす。
論文 参考訳(メタデータ) (2023-08-27T11:52:00Z) - Generative Novel View Synthesis with 3D-Aware Diffusion Models [96.78397108732233]
単一入力画像から3D対応の新規ビュー合成のための拡散モデルを提案する。
提案手法は既存の2次元拡散バックボーンを利用するが,重要な点として,幾何学的先行を3次元特徴体積の形で組み込む。
新たなビュー生成に加えて,本手法は3次元一貫性シーケンスを自己回帰的に合成する機能を備えている。
論文 参考訳(メタデータ) (2023-04-05T17:15:47Z) - High-fidelity 3D GAN Inversion by Pseudo-multi-view Optimization [51.878078860524795]
フォトリアリスティック・ノベルビューを合成可能な高忠実度3次元生成対向ネットワーク(GAN)インバージョン・フレームワークを提案する。
提案手法は,1枚の画像から高忠実度3Dレンダリングを可能にし,AI生成3Dコンテンツの様々な応用に期待できる。
論文 参考訳(メタデータ) (2022-11-28T18:59:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。