論文の概要: SuperQuadricOcc: Multi-Layer Gaussian Approximation of Superquadrics for Real-Time Self-Supervised Occupancy Estimation
- arxiv url: http://arxiv.org/abs/2511.17361v1
- Date: Fri, 21 Nov 2025 16:26:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.106627
- Title: SuperQuadricOcc: Multi-Layer Gaussian Approximation of Superquadrics for Real-Time Self-Supervised Occupancy Estimation
- Title(参考訳): SuperQuadricOcc: リアルタイム自己監督運転推定のためのスーパークワッドリックの多層ガウス近似
- Authors: Seamie Hayes, Reenu Mohandas, Tim Brophy, Alexandre Boulch, Ganesh Sistu, Ciaran Eising,
- Abstract要約: リアルタイム推論を実現するために,スーパークワッドリックを用いた占有モデルを提案する。
Occ3Dデータセットでは、SuperQuadricOccは75%のメモリフットプリントの削減、124%の高速化、mIoUの5.9%の改善を実現している。
私たちの知る限り、これは競争性能を維持しながらリアルタイムの推論を可能にする最初の占有モデルです。
- 参考スコア(独自算出の注目度): 38.85929062825556
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic occupancy estimation enables comprehensive scene understanding for automated driving, providing dense spatial and semantic information essential for perception and planning. While Gaussian representations have been widely adopted in self-supervised occupancy estimation, the deployment of a large number of Gaussian primitives drastically increases memory requirements and is not suitable for real-time inference. In contrast, superquadrics permit reduced primitive count and lower memory requirements due to their diverse shape set. However, implementation into a self-supervised occupancy model is nontrivial due to the absence of a superquadric rasterizer to enable model supervision. Our proposed method, SuperQuadricOcc, employs a superquadric-based scene representation. By leveraging a multi-layer icosphere-tessellated Gaussian approximation of superquadrics, we enable Gaussian rasterization for supervision during training. On the Occ3D dataset, SuperQuadricOcc achieves a 75\% reduction in memory footprint, 124\% faster inference, and a 5.9\% improvement in mIoU compared to previous Gaussian-based methods, without the use of temporal labels. To our knowledge, this is the first occupancy model to enable real-time inference while maintaining competitive performance. The use of superquadrics reduces the number of primitives required for scene modeling by 84\% relative to Gaussian-based approaches. Finally, evaluation against prior methods is facilitated by our fast superquadric voxelization module. The code will be released as open source.
- Abstract(参考訳): セマンティック占有推定は、自動走行のための総合的なシーン理解を可能にし、知覚と計画に不可欠な密集した空間的・意味的な情報を提供する。
ガウス表現は自己監督的占有推定において広く採用されているが、多数のガウスプリミティブの展開はメモリ要求を大幅に増加させ、リアルタイムの推論には適さない。
対照的に、スーパークワッドリックは、様々な形状セットのためにプリミティブカウントを減らし、メモリ要求を減らします。
しかし, モデル管理を実現するスーパークアッドリックラスタライザが存在しないため, 自己管理型占有モデルへの実装は容易ではない。
提案手法であるSuperQuadricOccは,スーパークワッドリックに基づくシーン表現を用いる。
超四重項の多層化ガウス近似を利用することにより、訓練中の監督のためにガウスラスタ化を可能にする。
Occ3Dデータセットでは、SuperQuadricOccはメモリフットプリントの75%削減、124\%高速化、mIoUの5.9\%改善を実現している。
私たちの知る限り、これは競争性能を維持しながらリアルタイムの推論を可能にする最初の占有モデルです。
スーパークワッドリックの使用により、シーンモデリングに必要なプリミティブの数がガウスベースのアプローチと比較して84\%削減される。
最後に, 高速なスーパークワッドボキセル化モジュールにより, 先行手法に対する評価を容易にする。
コードはオープンソースとしてリリースされる予定だ。
関連論文リスト
- ProtoGS: Efficient and High-Quality Rendering with 3D Gaussian Prototypes [81.48624894781257]
3D Gaussian Splatting (3DGS) は、新しいビュー合成において大きな進歩を遂げてきたが、ガウスプリミティブのかなりの数によって制限されている。
近年の手法では、密度の高いガウスの記憶容量を圧縮することでこの問題に対処しているが、レンダリングの品質と効率の維持には失敗している。
本稿では,ガウスの原始体を表現するためにガウスのプロトタイプを学習するProtoGSを提案し,視覚的品質を犠牲にすることなくガウスの総量を大幅に削減する。
論文 参考訳(メタデータ) (2025-03-21T18:55:14Z) - GaussianFlowOcc: Sparse and Weakly Supervised Occupancy Estimation using Gaussian Splatting and Temporal Flow [1.5129569747339653]
職業推定は3次元コンピュータビジョンにおいて顕著な課題となっている。
本稿では,GaussianFlowOccと呼ばれる,新規な占有率推定手法を提案する。
ガウススプラッティングにインスパイアされ、伝統的な密度の強いボクセル格子をスパース3Dガウス表現に置き換える。
論文 参考訳(メタデータ) (2025-02-24T16:16:01Z) - GaussianFormer-2: Probabilistic Gaussian Superposition for Efficient 3D Occupancy Prediction [55.60972844777044]
3Dセマンティック占有予測は、堅牢な視覚中心の自律運転において重要な課題である。
既存のほとんどの手法は、密度の高いグリッドベースのシーン表現を利用しており、運転シーンの空間的空間性を見渡している。
本稿では,各ガウス分布をその周辺領域の確率分布として解釈する確率論的ガウス重ね合わせモデルを提案する。
論文 参考訳(メタデータ) (2024-12-05T17:59:58Z) - OPUS: Occupancy Prediction Using a Sparse Set [64.60854562502523]
学習可能なクエリの集合を用いて、占有された場所とクラスを同時に予測するフレームワークを提案する。
OPUSには、モデルパフォーマンスを高めるための非自明な戦略が組み込まれている。
最も軽量なモデルではOcc3D-nuScenesデータセットの2倍 FPS に優れたRayIoUが得られる一方、最も重いモデルは6.1 RayIoUを上回ります。
論文 参考訳(メタデータ) (2024-09-14T07:44:22Z) - Efficient Inference via Universal LSH Kernel [35.22983601434134]
本稿では,単純なハッシュ計算と集約で推論手順を近似できる数列の簡潔な集合である,数学的に証明可能なRepresenter Sketchを提案する。
Representer Sketchは、カーネル文学から人気のあるRepresenter Theoremの上に構築されている。
本研究では,Representer Sketchによるストレージ要件の最大114倍,複雑性の最大59倍を精度の低下なく達成できることを示す。
論文 参考訳(メタデータ) (2021-06-21T22:06:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。