論文の概要: GlowGS: Generative Semantic Feature Learning for 3D Gaussian Splatting in Nighttime Glow Scenes
- arxiv url: http://arxiv.org/abs/2605.23602v1
- Date: Fri, 22 May 2026 13:11:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.361202
- Title: GlowGS: Generative Semantic Feature Learning for 3D Gaussian Splatting in Nighttime Glow Scenes
- Title(参考訳): GlowGS:夜間のGlowシーンにおける3次元ガウス平滑化のための生成的意味的特徴学習
- Authors: Beibei Lin, Xiao Cao, Jingyuan Guo, Robby T. Tan,
- Abstract要約: 既存の3DGS手法は、晴れた日のシーンで高品質なノベルビューを効果的にレンダリングする。
夜景、特に光沢のある地域では、テクスチャや縁のような構造的な特徴が欠如している。
拡散モデルとビジョンファンデーションモデルを利用して、欠落した構造的手がかりを補う。
提案手法は,セマンティック特徴生成と新規視点セマンティックラーニングという2つのキーとなる概念から構成される。
- 参考スコア(独自算出の注目度): 30.27941527395266
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing 3DGS methods effectively render high-quality novel views in clear-day scenes. However, they struggle with night scenes, particularly in glow regions, due to the lack of structural features such as textures and edges, which are key cues for splatting-based reconstruction. To address this problem, we leverage a diffusion model and a Vision Foundation Model (VFM) to compensate for missing structural cues. Our method consists of two key novel ideas: semantic feature generation and novel-view semantic learning. First, semantic feature generation produces high-quality semantic features as implicit structural cues for novel views. Specifically, a diffusion model synthesizes novel views with unknown camera poses from training views, while a VFM evaluates their quality. Once high-quality novel views are identified, the VFM extracts robust features to construct the semantic feature bank. Second, novel-view semantic learning enables 3DGS to optimize rendered novel views without requiring ground truth. It achieves this by extracting semantic features from a rendered novel view, searching the feature bank for the most similar features, and minimizing their distance. This process enforces implicit structural constraints, ensuring semantically coherent, artifact-free rendered views. Extensive experiments demonstrate the effectiveness of our GlowGS in generating semantically accurate 3D views, showing significant improvements over existing methods.
- Abstract(参考訳): 既存の3DGS手法は、晴れた日のシーンで高品質なノベルビューを効果的にレンダリングする。
しかし、夜景、特に光沢のある地域では、テクスチャや縁などの構造的特徴が欠如しているため、スプラッティングによる再建の鍵となる。
この問題に対処するために、拡散モデルとビジョンファンデーションモデル(VFM)を用いて、欠落した構造的手がかりを補う。
提案手法は,セマンティック特徴生成と新規視点セマンティックラーニングという2つのキーとなる概念から構成される。
第一に、セマンティック特徴生成は、新規ビューのための暗黙的な構造的手がかりとして高品質なセマンティック特徴を生成する。
具体的には、拡散モデルは、トレーニングビューから未知のカメラポーズで新しいビューを合成し、VFMはその品質を評価する。
高品質な新規ビューが特定されると、VFMはセマンティック・フィーチャーバンクを構築するために堅牢な特徴を抽出する。
第二に、3DGSは、基礎的な真実を必要とせずに、レンダリングされた新しいビューを最適化することができる。
描画された新規なビューから意味的特徴を抽出し、最も類似した特徴をフィーチャーバンクで検索し、その距離を最小化する。
このプロセスは暗黙的な構造的制約を強制し、セマンティック・コヒーレントでアーティファクトフリーなレンダリングビューを保証する。
大規模な実験により,GlowGSが意味的に正確な3Dビューを生成できることが実証された。
関連論文リスト
- SemGS: Feed-Forward Semantic 3D Gaussian Splatting from Sparse Views for Generalizable Scene Understanding [18.889530477440793]
SemGSは画像入力から一般化可能なセマンティックフィールドを再構築するためのフィードフォワードフレームワークである。
カメラ視点間の幾何学的関係を明示的にモデル化するために,特徴抽出器にカメラ対応アテンション機構を導入する。
実験により、SemGSはベンチマークデータセット上で最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2026-03-03T03:06:37Z) - SemanticNVS: Improving Semantic Scene Understanding in Generative Novel View Synthesis [25.524477911101325]
新規ビュー合成のためのカメラ条件付き多視点拡散モデルSemanticNVSを提案する。
既存のNVS法は、長距離カメラ動作下で意味的に不明瞭で歪んだ画像を生成する。
遠隔地でも高品質なシーンセマンティクスを実現するための条件付けとして,事前学習型セマンティクス抽出器を統合することを提案する。
論文 参考訳(メタデータ) (2026-02-23T17:45:21Z) - StdGEN++: A Comprehensive System for Semantic-Decomposed 3D Character Generation [57.06461272772509]
StdGEN++は、多種多様な入力から高忠実で意味的に分解された3D文字を生成するための、新しく包括的なシステムである。
最先端の性能を達成し、幾何学的精度と意味的絡み合いにおいて既存の手法を著しく上回っている。
結果として、非破壊的な編集、物理学に準拠したアニメーション、視線追跡など、より進んだ下流の機能をアンロックする。
論文 参考訳(メタデータ) (2026-01-12T15:41:27Z) - C3G: Learning Compact 3D Representations with 2K Gaussians [55.04010158339562]
近年の手法では3次元ガウススプラッティングを再構成に用い, シーン理解のための2D-to-3D機能昇降ステージが提案されている。
提案するC3Gは,空間的にのみコンパクトな3次元ガウスを推定する新しいフィードフォワードフレームワークである。
論文 参考訳(メタデータ) (2025-12-03T17:59:05Z) - UniForward: Unified 3D Scene and Semantic Field Reconstruction via Feed-Forward Gaussian Splatting from Only Sparse-View Images [43.40816438003861]
本稿では,3次元シーンとセマンティックフィールドの再構成を統一したフィードフォワードモデルを提案する。
我々のUniForwardは、スパースビュー画像のみから、3Dシーンと対応するセマンティックフィールドをリアルタイムで再構築することができる。
新規なビュー合成と新規なビューセグメンテーションの実験により,本手法が最先端の性能を達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T04:01:21Z) - ViewCrafter: Taming Video Diffusion Models for High-fidelity Novel View Synthesis [63.169364481672915]
単一またはスパース画像からジェネリックシーンの高忠実な新規ビューを合成する新しい方法である textbfViewCrafter を提案する。
提案手法は,映像拡散モデルの強力な生成能力と,ポイントベース表現によって提供される粗い3D手がかりを利用して高品質な映像フレームを生成する。
論文 参考訳(メタデータ) (2024-09-03T16:53:19Z) - DistillNeRF: Perceiving 3D Scenes from Single-Glance Images by Distilling Neural Fields and Foundation Model Features [65.8738034806085]
DistillNeRFは、自動運転シーンにおける3D環境を理解するための自己教師型学習フレームワークである。
本手法は,スパースで単一フレームのマルチビューカメラ入力からリッチなニューラルシーン表現を予測する一般化可能なフィードフォワードモデルである。
論文 参考訳(メタデータ) (2024-06-17T21:15:13Z) - Vision Transformer for NeRF-Based View Synthesis from a Single Input
Image [49.956005709863355]
本稿では,グローバルな特徴と局所的な特徴を両立させ,表現力のある3D表現を実現することを提案する。
新たなビューを合成するために,学習した3次元表現に条件付き多層パーセプトロン(MLP)ネットワークを訓練し,ボリュームレンダリングを行う。
提案手法は,1つの入力画像のみから新しいビューを描画し,複数のオブジェクトカテゴリを1つのモデルで一般化することができる。
論文 参考訳(メタデータ) (2022-07-12T17:52:04Z) - GramGAN: Deep 3D Texture Synthesis From 2D Exemplars [7.553635339893189]
本稿では,2次元画像が与えられた無限の高品質な3次元テクスチャの生成を可能にする,新しいテクスチャ合成フレームワークを提案する。
自然テクスチャ合成の最近の進歩に触発されて、学習されたノイズ周波数を非線形に組み合わせてテクスチャを生成するために、ディープニューラルネットワークを訓練する。
そこで本研究では,スタイル転送と生成対向ネットワークの両方からアイデアを結合した新たな損失関数を提案する。
論文 参考訳(メタデータ) (2020-06-29T15:22:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。