論文の概要: GaussianSSC: Triplane-Guided Directional Gaussian Fields for 3D Semantic Completion
- arxiv url: http://arxiv.org/abs/2603.21487v1
- Date: Mon, 23 Mar 2026 02:21:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.441814
- Title: GaussianSSC: Triplane-Guided Directional Gaussian Fields for 3D Semantic Completion
- Title(参考訳): Gaussian SSC:3次元セマンティック・コンプリートのための3次元誘導型指向型ガウス場
- Authors: Ruiqi Xian, Jing Liang, He Yin, Xuewei Qi, Dinesh Manocha,
- Abstract要約: セマンティックシーン補完(SSC)に対する2段階,グリッドネイティブ,三面誘導型アプローチであるEmphGaussian SSCを提案する。
本稿では,Voxel-imageアライメントの強化と単分子占有率推定の改善を図ったサブピクセルであるEmphGaussian Anchoringを紹介した。
我々はさらに点状ボクセル特徴を学習したボクセル・ガウシアン場に変換し、三面体を配向したエルフガウスアン-トリプレーン・リファインメントを通して三面体特徴を洗練する。
- 参考スコア(独自算出の注目度): 42.55859426003959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present \emph{GaussianSSC}, a two-stage, grid-native and triplane-guided approach to semantic scene completion (SSC) that injects the benefits of Gaussians without replacing the voxel grid or maintaining a separate Gaussian set. We introduce \emph{Gaussian Anchoring}, a sub-pixel, Gaussian-weighted image aggregation over fused FPN features that tightens voxel--image alignment and improves monocular occupancy estimation. We further convert point-like voxel features into a learned per-voxel Gaussian field and refine triplane features via a triplane-aligned \emph{Gaussian--Triplane Refinement} module that combines \emph{local gathering} (target-centric) and \emph{global aggregation} (source-centric). This directional, anisotropic support captures surface tangency, scale, and occlusion-aware asymmetry while preserving the efficiency of triplane representations. On SemanticKITTI~\cite{behley2019semantickitti}, GaussianSSC improves Stage~1 occupancy by +1.0\% Recall, +2.0\% Precision, and +1.8\% IoU over state-of-the-art baselines, and improves Stage~2 semantic prediction by +1.8\% IoU and +0.8\% mIoU.
- Abstract(参考訳): 本稿では,2段階,グリッドネイティブ,三面誘導によるセマンティックシーンコンプリート(SSC)アプローチである \emph{GaussianSSC} について述べる。
本稿では,Voxel-imageアライメントの強化と単分子占有率推定の改善を図ったサブピクセルのガウス強調画像アグリゲーションである \emph{Gaussian Anchoring} を紹介する。
さらに、点状のボクセル特徴を学習されたボクセル・ガウス場に変換し、三面体整列 \emph{Gaussian--Triplane Refinement} モジュールを介して三面体特徴を洗練させ、これは \emph{local gathering} (ターゲット中心) と \emph{global aggregate} (ソース中心) を組み合わせたものである。
この方向異方性支持は、三面面表現の効率を保ちながら表面タンジェンシー、スケール、オクルージョン認識非対称性を捕捉する。
SemanticKITTI~\cite{behley2019semantickitti} では、Gaussian SSC がステージ~1占有率を +1.0\% Recall, +2.0\% Precision, +1.8\% IoU で改善し、ステージ~2意味予測を +1.8\% IoU と +0.8\% mIoU で改善している。
関連論文リスト
- GaussianCross: Cross-modal Self-supervised 3D Representation Learning via Gaussian Splatting [16.179607149692398]
提案するGaussianCrossは, クロスモーダルな自己教師型3D表現学習アーキテクチャである。
GaussianCross はスケール一貫性のない3次元点雲を統一された立方体正規化ガウス表現にシームレスに変換する。
最先端の手法と比較して線形探索(0.1%パラメータ)と限られたデータトレーニング(1%のシーン)により優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-08-04T08:12:44Z) - GaussianFormer-2: Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction [55.60972844777044]
3Dセマンティック占有予測は、堅牢な視覚中心の自律運転において重要な課題である。
既存のほとんどの手法は、密度の高いグリッドベースのシーン表現を利用しており、運転シーンの空間的空間性を見渡している。
本稿では,各ガウス分布をその周辺領域の確率分布として解釈する確率論的ガウス重ね合わせモデルを提案する。
論文 参考訳(メタデータ) (2024-12-05T17:59:58Z) - GaussianSpa: An "Optimizing-Sparsifying" Simplification Framework for Compact and High-Quality 3D Gaussian Splatting [12.342660713851227]
3D Gaussian Splatting (3DGS) は、ガウス関数の連続的な集合を利用して、新しいビュー合成の主流として登場した。
3DGSは、ガウシアンの多さを記憶するためのかなりのメモリ要件に悩まされており、その実用性を妨げている。
コンパクトで高品質な3DGSのための最適化ベースの単純化フレームワークであるGaussianSpaを紹介する。
論文 参考訳(メタデータ) (2024-11-09T00:38:06Z) - GPS-Gaussian: Generalizable Pixel-wise 3D Gaussian Splatting for Real-time Human Novel View Synthesis [70.24111297192057]
我々は、文字の新たなビューをリアルタイムに合成するための新しいアプローチ、GPS-Gaussianを提案する。
提案手法は,スパースビューカメラ設定下での2K解像度のレンダリングを可能にする。
論文 参考訳(メタデータ) (2023-12-04T18:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。