論文の概要: ArtifactWorld: Scaling 3D Gaussian Splatting Artifact Restoration via Video Generation Models
- arxiv url: http://arxiv.org/abs/2604.12251v1
- Date: Tue, 14 Apr 2026 03:55:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.222722
- Title: ArtifactWorld: Scaling 3D Gaussian Splatting Artifact Restoration via Video Generation Models
- Title(参考訳): アーティファクトワールド:映像生成モデルによる3次元ガウス鋳型アーチファクト復元のスケーリング
- Authors: Xinliang Wang, Yifeng Shi, Zhenyu Wu,
- Abstract要約: ArtifactWorldは3DGSのアーティファクト修復を、体系的な拡張と同質なデュアルモデルパラダイムを通じて解決するフレームワークである。
この結果から,アーティファクトワールドは,スパース・ビュー・シンセサイザーとロバストな3次元再構成において,最先端の性能を達成できることが示唆された。
- 参考スコア(独自算出の注目度): 13.182092898781292
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Gaussian Splatting (3DGS) delivers high-fidelity real-time rendering but suffers from geometric and photometric degradations under sparse-view constraints. Current generative restoration approaches are often limited by insufficient temporal coherence, a lack of explicit spatial constraints, and a lack of large-scale training data, resulting in multi-view inconsistencies, erroneous geometric hallucinations, and limited generalization to diverse real-world artifact distributions. In this paper, we present ArtifactWorld, a framework that resolves 3DGS artifact repair through systematic data expansion and a homogeneous dual-model paradigm. To address the data bottleneck, we establish a fine-grained phenomenological taxonomy of 3DGS artifacts and construct a comprehensive training set of 107.5K diverse paired video clips to enhance model robustness. Architecturally, we unify the restoration process within a video diffusion backbone, utilizing an isomorphic predictor to localize structural defects via an artifact heatmap. This heatmap then guides the restoration through an Artifact-Aware Triplet Fusion mechanism, enabling precise, intensity-guided spatio-temporal repair within native self-attention. Extensive experiments demonstrate that ArtifactWorld achieves state-of-the-art performance in sparse novel view synthesis and robust 3D reconstruction. Code and dataset will be made public.
- Abstract(参考訳): 3D Gaussian Splatting (3DGS) は高忠実なリアルタイムレンダリングを提供するが、スパースビュー制約下での幾何学的および測光的劣化に悩まされている。
現在の生成的復元アプローチは、時間的コヒーレンス不足、明示的な空間的制約の欠如、大規模なトレーニングデータの欠如によって制限されることが多く、その結果、多視点の不整合、誤った幾何学的幻覚、および様々な現実世界のアーティファクト分布への一般化が制限される。
本稿では,3DGSのアーティファクト修復を,体系的なデータ拡張と同質な二重モデルパラダイムによって解決するフレームワークであるArtifactWorldを提案する。
データボトルネックに対処するため、3DGSアーティファクトの微細な表現学的分類を確立し、モデルロバスト性を高めるために107.5Kの多様なペアビデオクリップからなる総合的なトレーニングセットを構築した。
構造的には,ビデオ拡散バックボーン内の復元過程を統一し,同型予測器を用いてアーチファクトヒートマップを用いて構造欠陥の局所化を行う。
このヒートマップはArtifact-Aware Triplet Fusion機構を通じて修復を誘導し、自然の自己注意の中で正確な、強度誘導された時空間的修復を可能にする。
広汎な実験により、ArtifactWorldはスパース・ノウ・ビュー・シンセサイザーとロバストな3D再構成において最先端のパフォーマンスを達成することが実証された。
コードとデータセットは公開されます。
関連論文リスト
- ERGO: Excess-Risk-Guided Optimization for High-Fidelity Monocular 3D Gaussian Splatting [63.138778159026934]
本稿では,ERGOと呼ばれる過度のリスク分解によって導かれる適応最適化フレームワークを提案する。
ERGOはビュー固有の過剰リスクを動的に推定し、最適化中の損失重みを適応的に調整する。
Google Scanned ObjectsデータセットとOmniObject3Dデータセットの実験は、既存の最先端メソッドよりもERGOの方が優れていることを示している。
論文 参考訳(メタデータ) (2026-02-10T20:44:43Z) - ReconViaGen: Towards Accurate Multi-view 3D Object Reconstruction via Generation [28.308731720451053]
我々はReconViaGenを提案する。
我々のReconViaGenは、グローバルな構造と局所的な詳細の両方において、入力ビューと整合した完全かつ正確な3Dモデルを再構築できることを実証した。
論文 参考訳(メタデータ) (2025-10-27T13:15:06Z) - HBSplat: Robust Sparse-View Gaussian Reconstruction with Hybrid-Loss Guided Depth and Bidirectional Warping [11.035994094874141]
HBSplatは、堅牢な構造的キュー、仮想ビュー制約、隠蔽された領域補完をシームレスに統合するフレームワークである。
HBSplatは21.13dBのPSNRと0.189LPIPSを達成し、リアルタイム推論を維持している。
論文 参考訳(メタデータ) (2025-09-29T15:03:31Z) - OracleGS: Grounding Generative Priors for Sparse-View Gaussian Splatting [78.70702961852119]
OracleGSは、Gaussian Splattingのスパースビューのために、生成的完全性と回帰的忠実性を調整している。
提案手法は,多視点幾何学的証拠に先立って強力な生成条件を定め,幻覚的アーティファクトをフィルタリングし,非拘束領域における可塑性完備を保存している。
論文 参考訳(メタデータ) (2025-09-27T11:19:32Z) - RLGF: Reinforcement Learning with Geometric Feedback for Autonomous Driving Video Generation [75.61028930882144]
この重要な問題を特定し定量化し,合成データと実データを用いた場合の3次元物体検出における顕著な性能差を示す。
本稿では,RLGFを用いた強化学習(Reinforcement Learning with Geometric Feedback, RLGF)を紹介する。
RLGFは幾何誤差(例えばVPエラーを21%、深さエラーを57%)を大幅に削減し、3Dオブジェクト検出のmAPを12.7%改善し、実際のデータ性能のギャップを狭める。
論文 参考訳(メタデータ) (2025-09-20T02:23:36Z) - GSFixer: Improving 3D Gaussian Splatting with Reference-Guided Video Diffusion Priors [44.901133648775605]
GSFixerは、スパース入力から再構築された3DGS表現の品質を改善するために設計されたフレームワークである。
本モデルは,視覚幾何学基礎モデルから抽出した参照ビューの2次元意味的特徴と3次元幾何学的特徴を統合した。
3DGSアーティファクト復元評価のための適切なベンチマークが欠如していることを踏まえ,低品質な3DGSを用いてレンダリングされたアーティファクトフレームを含むDL3DV-Resを提案する。
論文 参考訳(メタデータ) (2025-08-13T09:56:28Z) - GSD: View-Guided Gaussian Splatting Diffusion for 3D Reconstruction [52.04103235260539]
単一視点からの3次元オブジェクト再構成のためのガウススプティング表現に基づく拡散モデル手法を提案する。
モデルはGS楕円体の集合で表される3Dオブジェクトを生成することを学習する。
最終的な再構成されたオブジェクトは、高品質な3D構造とテクスチャを持ち、任意のビューで効率的にレンダリングできる。
論文 参考訳(メタデータ) (2024-07-05T03:43:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。