Fugu-MT 論文翻訳(概要): Gau-Occ: Geometry-Completed Gaussians for Multi-Modal 3D Occupancy Prediction

論文の概要: Gau-Occ: Geometry-Completed Gaussians for Multi-Modal 3D Occupancy Prediction

arxiv url: http://arxiv.org/abs/2603.22852v1
Date: Tue, 24 Mar 2026 06:44:46 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-25 19:53:37.338351
Title: Gau-Occ: Geometry-Completed Gaussians for Multi-Modal 3D Occupancy Prediction
Title（参考訳）: Gau-Occ:マルチモーダル3次元動作予測のための幾何完備ガウス
Authors: Chengxin Lv, Yihui Li, Hongyu Yang, YunHong Wang,
Abstract要約: Gau-Occは、密度の高いボリューム処理をバイパスするマルチモーダルフレームワークである。幾何整列した2Dサンプリングとクロスモーダルアライメントにより、マルチビューイメージセマンティクスを統合する。
参考スコア（独自算出の注目度）: 40.5891357994769
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: 3D semantic occupancy prediction is crucial for autonomous driving. While multi-modal fusion improves accuracy over vision-only methods, it typically relies on computationally expensive dense voxel or BEV tensors. We present Gau-Occ, a multi-modal framework that bypasses dense volumetric processing by modeling the scene as a compact collection of semantic 3D Gaussians. To ensure geometric completeness, we propose a LiDAR Completion Diffuser (LCD) that recovers missing structures from sparse LiDAR to initialize robust Gaussian anchors. Furthermore, we introduce Gaussian Anchor Fusion (GAF), which efficiently integrates multi-view image semantics via geometry-aligned 2D sampling and cross-modal alignment. By refining these compact Gaussian descriptors, Gau-Occ captures both spatial consistency and semantic discriminability. Extensive experiments across challenging benchmarks demonstrate that Gau-Occ achieves state-of-the-art performance with significant computational efficiency.
Abstract（参考訳）: 3Dセマンティック占有予測は自動運転に不可欠である。マルチモーダル融合は視覚のみの手法よりも精度が向上するが、通常は計算に高価な高密度ボクセルやBEVテンソルに依存している。シーンをセマンティックな3Dガウスアンのコンパクトなコレクションとしてモデル化することにより,高密度ボリューム処理をバイパスするマルチモーダルフレームワークであるGau-Occを提案する。幾何学的完全性を確保するために,疎LiDARから欠落構造を復元し,ロバストなガウスアンカーを初期化するLiDAR Completion Diffuser (LCD)を提案する。さらに,Gaussian Anchor Fusion (GAF)を導入し,多視点画像セマンティクスを幾何整列2次元サンプリングとクロスモーダルアライメントにより効率的に統合する。これらのコンパクトなガウス記述子を書き換えることにより、ガウオックは空間的一貫性と意味的識別性の両方をキャプチャする。挑戦的なベンチマークによる大規模な実験は、Gau-Occが最先端の性能を高い計算効率で達成していることを示している。

関連論文リスト

GaussianOcc3D: A Gaussian-Based Adaptive Multi-modal 3D Occupancy Prediction [0.0]
セマンティック占有率予測のためのメモリ効率・連続3次元ガウス表現フレームワークを提案する。ガウシアンOcc3Dは、雨と夜間の困難な状況にまたがって優れた堅牢性を示す。
論文参考訳（メタデータ） (2026-01-30T09:05:30Z)
C3G: Learning Compact 3D Representations with 2K Gaussians [55.04010158339562]
近年の手法では3次元ガウススプラッティングを再構成に用い, シーン理解のための2D-to-3D機能昇降ステージが提案されている。提案するC3Gは,空間的にのみコンパクトな3次元ガウスを推定する新しいフィードフォワードフレームワークである。
論文参考訳（メタデータ） (2025-12-03T17:59:05Z)
ShelfGaussian: Shelf-Supervised Open-Vocabulary Gaussian-based 3D Scene Understanding [7.610505486431266]
オープンボキャブラリ型多モードガウス型3Dシーン理解フレームワークであるShelfGaussianについて紹介する。既存の手法は、オブジェクトをアノテーション付き3Dラベルで教師される閉集合意味ガウスとしてモデル化し、そのレンダリング能力を無視したり、純粋に2Dの自己スーパービジョンを通じてオープンセットガウス表現を学習する。
論文参考訳（メタデータ） (2025-12-03T02:06:09Z)
GauSSmart: Enhanced 3D Reconstruction through 2D Foundation Models and Geometric Filtering [50.675710727721786]
2次元基礎モデルと3次元ガウススプラッティング再構成をブリッジするハイブリッド手法であるGauSSmartを提案する。提案手法は,凸フィルタリングや意味的特徴監視など,確立した2次元コンピュータビジョン技術を統合している。 GauSSmartは既存のGaussian Splattingよりも一貫して優れています。
論文参考訳（メタデータ） (2025-10-16T03:38:26Z)
SDGOCC: Semantic and Depth-Guided Bird's-Eye View Transformation for 3D Multimodal Occupancy Prediction [8.723840755505817]
SDG-OCCと呼ばれる新しいマルチモーダル占有予測ネットワークを提案する。ジョイントセマンティックとディープ誘導ビュー変換と、融合により占有されるアクティブ蒸留が組み込まれている。提案手法は,Occ3D-nuScenesデータセットをリアルタイムに処理することで,最先端(SOTA)性能を実現する。
論文参考訳（メタデータ） (2025-07-22T23:49:40Z)
ODG: Occupancy Prediction Using Dual Gaussians [38.9869091446875]
活動予測は周囲環境のカメラ画像から微細な3次元形状と意味を推定する。既存の方法は、シーン表現として高密度グリッドを採用するか、単一のスパースクエリを使用してシーン全体を学習する。複雑なシーンダイナミクスを効果的に捉えるために,階層的な二重スパースガウス表現であるODGを提案する。
論文参考訳（メタデータ） (2025-06-11T06:03:03Z)
GaussianFormer3D: Multi-Modal Gaussian-based Semantic Occupancy Prediction with 3D Deformable Attention [15.890744831541452]
3Dセマンティック占有予測は、安全で信頼性の高い自動運転を実現するために重要である。本稿では,3次元変形可能な注意力を利用したマルチモーダルガウスに基づくセマンティック占有予測フレームワークを提案する。
論文参考訳（メタデータ） (2025-05-15T20:05:08Z)
econSG: Efficient and Multi-view Consistent Open-Vocabulary 3D Semantic Gaussians [56.85804719947]
3DGSを用いたオープン語彙セマンティックセマンティックセグメンテーションのためのeconSGを提案する。筆者らのeconSGは,既存手法と比較して,4つのベンチマークデータセット上での最先端性能を示す。
論文参考訳（メタデータ） (2025-04-08T13:12:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。