論文の概要: Diffusion-guided Generalizable Enhancer for Urban Scene Reconstruction
- arxiv url: http://arxiv.org/abs/2605.22420v1
- Date: Thu, 21 May 2026 12:41:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.258723
- Title: Diffusion-guided Generalizable Enhancer for Urban Scene Reconstruction
- Title(参考訳): 都市景観再生のための拡散誘導型一般化エンハンサー
- Authors: Henry Che, Jingkang Wang, Yun Chen, Ze Yang, Sivabalan Manivasagam, Raquel Urtasun,
- Abstract要約: 都市景観再構築のための新しい拡散誘導型一般化エンハンサーGenReを提案する。
GenReは、様々なシーンにまたがって生成前駆体を蒸留することを学ぶことで、堅牢で高忠実な表現を効率的に生成する。
実験により、GenReは、品質と効率の両方で既存のメソッドよりも優れています。
- 参考スコア(独自算出の注目度): 30.391397431557056
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Urban scene reconstruction from real-world observations has emerged as a powerful tool for self-driving development and testing. While current neural rendering approaches achieve high-fidelity rendering along the recorded trajectories, their quality degrades significantly under large viewpoint shifts, limiting the applicability for closed-loop simulation. Recent works have shown promising results in using diffusion models to enhance quality at these challenging viewpoints and distill improvements back into 3D representations. However, they often require costly per-scene optimization, and the distilled representations remain fragile and fail to generalize beyond limited synthesized views. To address these limitations, we propose GenRe, a novel diffusion-guided generalizable enhancer for urban scene reconstruction. GenRe takes as input any pretrained 3D Gaussian representation and fixes the deficiencies within a few minutes. By learning to distill generative priors across diverse scenes, GenRe produces robust and high-fidelity representation efficiently that generalizes reliably to challenging unseen viewpoints (e.g., lane change). Experiments show that GenRe outperforms existing methods in both quality and efficiency and benefits various downstream tasks, enabling robust and scalable sensor simulation for autonomous driving.
- Abstract(参考訳): 実世界の観測から得られた都市景観の再構築は、自動運転開発とテストのための強力なツールとして現れている。
現在のニューラルレンダリングアプローチは記録された軌道に沿って高忠実なレンダリングを実現するが、その品質は大きな視点シフトの下で著しく低下し、クローズドループシミュレーションの適用性が制限される。
近年の研究では, 拡散モデルを用いて, これらの難解な視点で品質を高め, 3次元表現に戻すという有望な成果が示されている。
しかし、それらはしばしばコストのかかるシーンごとの最適化を必要とし、蒸留された表現は脆弱であり、限られた合成されたビューを超えて一般化することができない。
これらの制約に対処するために,都市景観再構築のための新しい拡散誘導一般化エンハンサーであるGenReを提案する。
GenReは事前訓練された3Dガウス表現を入力として取り、数分で欠陥を修正する。
GenReは、様々なシーンにまたがって生成前の前駆体を蒸留することを学ぶことで、堅牢で高忠実な表現を効率よく生成し、不明瞭な視点(車線変更など)に確実に一般化する。
実験によると、GenReは、品質と効率の両方で既存の手法より優れており、さまざまな下流タスクの恩恵を受けており、自律運転のための堅牢でスケーラブルなセンサーシミュレーションを可能にしている。
関連論文リスト
- VidSplat: Gaussian Splatting Reconstruction with Geometry-Guided Video Diffusion Priors [79.88300861391114]
VidSplatは、トレーニング不要な生成的再構築フレームワークである。
生成と再構築の効果的な統合を可能にする2つの重要な課題に取り組む。
広範に使用されているベンチマーク実験は、スパースビューのシーン再構成における優れた性能を示している。
論文 参考訳(メタデータ) (2026-05-12T02:20:31Z) - ReconViaGen: Towards Accurate Multi-view 3D Object Reconstruction via Generation [28.308731720451053]
我々はReconViaGenを提案する。
我々のReconViaGenは、グローバルな構造と局所的な詳細の両方において、入力ビューと整合した完全かつ正確な3Dモデルを再構築できることを実証した。
論文 参考訳(メタデータ) (2025-10-27T13:15:06Z) - OracleGS: Grounding Generative Priors for Sparse-View Gaussian Splatting [78.70702961852119]
OracleGSは、Gaussian Splattingのスパースビューのために、生成的完全性と回帰的忠実性を調整している。
提案手法は,多視点幾何学的証拠に先立って強力な生成条件を定め,幻覚的アーティファクトをフィルタリングし,非拘束領域における可塑性完備を保存している。
論文 参考訳(メタデータ) (2025-09-27T11:19:32Z) - RobustGS: Unified Boosting of Feedforward 3D Gaussian Splatting under Low-Quality Conditions [67.48495052903534]
本稿では,汎用的で効率的なマルチビュー機能拡張モジュールRobustGSを提案する。
各種の有害撮像条件下でのフィードフォワード3DGS法のロバスト性を大幅に向上させる。
RobustGSモジュールはプラグイン・アンド・プレイ方式で既存の事前訓練パイプラインにシームレスに統合できる。
論文 参考訳(メタデータ) (2025-08-05T04:50:29Z) - Intern-GS: Vision Model Guided Sparse-View 3D Gaussian Splatting [95.61137026932062]
Intern-GSはスパースビューガウススプラッティングのプロセスを強化する新しいアプローチである。
Intern-GSは多様なデータセットにまたがって最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2025-05-27T05:17:49Z) - GenFusion: Closing the Loop between Reconstruction and Generation via Videos [24.195304481751602]
本稿では,再現性のあるRGB-Dレンダリングにおける映像フレームの条件付けを学習する再構成駆動型ビデオ拡散モデルを提案する。
また、生成モデルからトレーニングセットへの復元フレームを反復的に追加する循環核融合パイプラインを提案する。
論文 参考訳(メタデータ) (2025-03-27T07:16:24Z) - 3D Gaussian Splatting against Moving Objects for High-Fidelity Street Scene Reconstruction [1.2603104712715607]
本稿では,ダイナミックストリートシーン再構築のための新しい3次元ガウス点分布法を提案する。
提案手法では,高忠実度な静的シーンを保存しながらオブジェクトの移動を除去する。
実験により, 大規模動的環境における再現性の向上, レンダリング性能の向上, 適応性の向上が示された。
論文 参考訳(メタデータ) (2025-03-15T05:41:59Z) - MuDG: Taming Multi-modal Diffusion with Gaussian Splatting for Urban Scene Reconstruction [44.592566642185425]
MuDGはマルチモーダル拡散モデルとガウススプラッティング(GS)を統合した革新的なフレームワークである。
我々は,MDGが再現性および光現実性合成品質の両方において,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-03-13T17:48:41Z) - Scaffold-GS: Structured 3D Gaussians for View-Adaptive Rendering [71.44349029439944]
最近の3次元ガウス散乱法は、最先端のレンダリング品質と速度を達成している。
局所的な3Dガウス分布にアンカーポイントを用いるScaffold-GSを導入する。
提案手法は,高品質なレンダリングを実現しつつ,冗長なガウスを効果的に削減できることを示す。
論文 参考訳(メタデータ) (2023-11-30T17:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。