論文の概要: Towards Accurate Single Panoramic 3D Detection: A Semantic Gaussian Centric Approach
- arxiv url: http://arxiv.org/abs/2605.14601v1
- Date: Thu, 14 May 2026 09:14:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.745688
- Title: Towards Accurate Single Panoramic 3D Detection: A Semantic Gaussian Centric Approach
- Title(参考訳): 単一パノラマ3次元検出の高精度化に向けて : セマンティックガウス心的アプローチ
- Authors: Kanglin Ning, Yiran Zhao, Wenrui Li, Shaoru Sun, Xingtao Wang, Xiaopeng Fan,
- Abstract要約: PanoGSDetは、連続的なセマンティックな3Dガウス表現に基づいて構築された単分子パノラマ3D検出フレームワークである。
我々の手法は既存の手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 40.65932713420619
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Three-dimensional object detection in panoramic imagery is crucial for comprehensive scene understanding, yet accurately mapping 2D features to 3D remains a significant challenge. Prevailing methods often project 2D features onto discrete 3D grids, which break geometric continuity and limit representation efficiency. To overcome this limitation, this paper proposes PanoGSDet, a monocular panoramic 3D detection framework built upon continuous semantic 3D Gaussian representations. The proposed framework comprises a panoramic depth estimation component and a semantic Gaussian component. The panoramic depth estimation component extracts the equirectangular semantic and depth features from the monocular panorama input. The semantic Gaussian component includes a semantic Gaussian lifting module that projects spherical features into 3D semantic Gaussians, a semantic Gaussian optimization module that refines these semantic Gaussians, and a Gaussian guided prediction head that generates 3D bounding boxes from optimized Gaussian representations. Extensive experiments on the Structured3D dataset demonstrate that our method significantly outperforms existing methods.
- Abstract(参考訳): パノラマ画像における3次元物体検出は、総合的なシーン理解には不可欠であるが、正確に2次元特徴を3Dにマッピングすることは重要な課題である。
一般的な方法は、しばしば2次元特徴を離散的な3次元グリッドに投影し、幾何学的連続性と制限表現効率を損なう。
この制限を克服するために,連続的なセマンティックな3Dガウス表現に基づいて構築された単分子パノラマ3D検出フレームワークであるPanoGSDetを提案する。
提案フレームワークはパノラマ深さ推定成分と意味ガウス成分からなる。
パノラマ深さ推定成分は、単分子パノラマ入力から等方的意味と深さの特徴を抽出する。
セマンティックガウス成分は、球面特徴を3Dセマンティックガウスに射影するセマンティックガウスリフトモジュールと、これらのセマンティックガウスを洗練させるセマンティックガウス最適化モジュールと、最適化されたガウス表現から3Dバウンディングボックスを生成するガウスガイド付き予測ヘッドとを含む。
Structured3Dデータセットの大規模な実験により,本手法が既存手法より大幅に優れていることが示された。
関連論文リスト
- Gau-Occ: Geometry-Completed Gaussians for Multi-Modal 3D Occupancy Prediction [40.5891357994769]
Gau-Occは、密度の高いボリューム処理をバイパスするマルチモーダルフレームワークである。
幾何整列した2Dサンプリングとクロスモーダルアライメントにより、マルチビューイメージセマンティクスを統合する。
論文 参考訳(メタデータ) (2026-03-24T06:44:46Z) - GVSynergy-Det: Synergistic Gaussian-Voxel Representations for Multi-View 3D Object Detection [18.809986709717446]
画像に基づく3Dオブジェクト検出は、RGB画像のみを使用して3D空間内のオブジェクトを識別およびローカライズすることを目的としている。
既存の画像ベースのアプローチは、2つの重要な課題に直面している。
本稿では,GVSynergy-Detを提案する。GVSynergy-Detは,相乗的ガウス・ボクセル表現学習による3次元検出を強化するフレームワークである。
論文 参考訳(メタデータ) (2025-12-29T03:34:39Z) - C3G: Learning Compact 3D Representations with 2K Gaussians [55.04010158339562]
近年の手法では3次元ガウススプラッティングを再構成に用い, シーン理解のための2D-to-3D機能昇降ステージが提案されている。
提案するC3Gは,空間的にのみコンパクトな3次元ガウスを推定する新しいフィードフォワードフレームワークである。
論文 参考訳(メタデータ) (2025-12-03T17:59:05Z) - ShelfGaussian: Shelf-Supervised Open-Vocabulary Gaussian-based 3D Scene Understanding [7.610505486431266]
オープンボキャブラリ型多モードガウス型3Dシーン理解フレームワークであるShelfGaussianについて紹介する。
既存の手法は、オブジェクトをアノテーション付き3Dラベルで教師される閉集合意味ガウスとしてモデル化し、そのレンダリング能力を無視したり、純粋に2Dの自己スーパービジョンを通じてオープンセットガウス表現を学習する。
論文 参考訳(メタデータ) (2025-12-03T02:06:09Z) - GauSSmart: Enhanced 3D Reconstruction through 2D Foundation Models and Geometric Filtering [50.675710727721786]
2次元基礎モデルと3次元ガウススプラッティング再構成をブリッジするハイブリッド手法であるGauSSmartを提案する。
提案手法は,凸フィルタリングや意味的特徴監視など,確立した2次元コンピュータビジョン技術を統合している。
GauSSmartは既存のGaussian Splattingよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-10-16T03:38:26Z) - GaussianFormer3D: Multi-Modal Gaussian-based Semantic Occupancy Prediction with 3D Deformable Attention [15.890744831541452]
3Dセマンティック占有予測は、安全で信頼性の高い自動運転を実現するために重要である。
本稿では,3次元変形可能な注意力を利用したマルチモーダルガウスに基づくセマンティック占有予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-15T20:05:08Z) - Semantic Gaussians: Open-Vocabulary Scene Understanding with 3D Gaussian Splatting [27.974762304763694]
セマンティック・ガウシアン(Semantic Gaussians)は,3次元ガウシアン・スプレイティングをベースとした,新しいオープン語彙シーン理解手法である。
既存の手法とは異なり、様々な2次元意味的特徴を3次元ガウスの新たな意味的構成要素にマッピングする多目的投影手法を設計する。
我々は,高速な推論のために,生の3Dガウスから意味成分を直接予測する3Dセマンティックネットワークを構築した。
論文 参考訳(メタデータ) (2024-03-22T21:28:19Z) - GIR: 3D Gaussian Inverse Rendering for Relightable Scene Factorization [62.13932669494098]
本稿では,3次元ガウス表現を用いた3次元ガウス逆レンダリング(GIR)手法を提案する。
最短固有ベクトルを用いて各3次元ガウスの正規性を計算する。
我々は3次元ガウシアン毎に方向対応の放射光を格納し、多重バウンス光輸送を近似するために二次照明をアンタングルするために、効率的なボクセルベースの間接照明追跡方式を採用する。
論文 参考訳(メタデータ) (2023-12-08T16:05:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。