論文の概要: HyGE-Occ: Hybrid View-Transformation with 3D Gaussian and Edge Priors for 3D Panoptic Occupancy Prediction
- arxiv url: http://arxiv.org/abs/2512.19871v1
- Date: Mon, 22 Dec 2025 20:59:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-24 19:17:49.662381
- Title: HyGE-Occ: Hybrid View-Transformation with 3D Gaussian and Edge Priors for 3D Panoptic Occupancy Prediction
- Title(参考訳): HyGE-Occ:3次元ガウスとエッジを優先したハイブリッドビュー変換による3次元パノプティクスの動作予測
- Authors: Jong Wook Kim, Wonseok Roh, Ha Dam Baek, Pilhyeon Lee, Jonghyun Choi, Sangpil Kim,
- Abstract要約: 3D Panoptic Occupancy Prediction は,3次元空間における各占有領域のセマンティッククラスとインスタンスアイデンティティを予測することによって,密度の高いボリュームシーンマップを再構築することを目的としている。
既存のアプローチは、しばしば正確な幾何学を維持し、堅牢な単視分離に不可欠な3Dインスタンスの正確な空間範囲を捉えるのに苦労する。
HyGE-Occは3次元ガウスとエッジを持つハイブリッドビュー・トランスフォーメーション・ブランチを利用して幾何学的一貫性と境界認識を向上する新しいフレームワークである。
Occ3D-nuScenesデータセットの実験では、HyGE-Occは既存の作業よりも優れており、優れた3次元幾何学的推論が示されています。
- 参考スコア(独自算出の注目度): 37.29855801224287
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: 3D Panoptic Occupancy Prediction aims to reconstruct a dense volumetric scene map by predicting the semantic class and instance identity of every occupied region in 3D space. Achieving such fine-grained 3D understanding requires precise geometric reasoning and spatially consistent scene representation across complex environments. However, existing approaches often struggle to maintain precise geometry and capture the precise spatial range of 3D instances critical for robust panoptic separation. To overcome these limitations, we introduce HyGE-Occ, a novel framework that leverages a hybrid view-transformation branch with 3D Gaussian and edge priors to enhance both geometric consistency and boundary awareness in 3D panoptic occupancy prediction. HyGE-Occ employs a hybrid view-transformation branch that fuses a continuous Gaussian-based depth representation with a discretized depth-bin formulation, producing BEV features with improved geometric consistency and structural coherence. In parallel, we extract edge maps from BEV features and use them as auxiliary information to learn edge cues. In our extensive experiments on the Occ3D-nuScenes dataset, HyGE-Occ outperforms existing work, demonstrating superior 3D geometric reasoning.
- Abstract(参考訳): 3D Panoptic Occupancy Prediction は,3次元空間における各占有領域のセマンティッククラスとインスタンスアイデンティティを予測することにより,密度の高いボリュームシーンマップを再構築することを目的としている。
このようなきめ細かい3次元理解を実現するには、複雑な環境を横断する正確な幾何学的推論と空間的に一貫したシーン表現が必要である。
しかし、既存のアプローチはしばしば正確な幾何学を維持し、堅牢な単視分離に不可欠な3Dインスタンスの正確な空間範囲を捉えるのに苦労する。
このような制約を克服するため,HyGE-Occは3次元ガウスとエッジを先行したハイブリッドビュー・トランスフォーメーション・ブランチを活用し,幾何学的整合性と境界認識の両立を図った新しいフレームワークである。
HyGE-Occは、連続したガウスに基づく深度表現と離散化された深度ビンの定式化を融合させ、幾何学的整合性と構造的コヒーレンスを改善したBEV特徴を生成するハイブリッドビュー変換ブランチを採用している。
並行して、BEV特徴量からエッジマップを抽出し、エッジキューを学習するための補助情報として使用する。
Occ3D-nuScenesデータセットに関する大規模な実験では、HyGE-Occは既存の作業よりも優れており、優れた3次元幾何学的推論が示されています。
関連論文リスト
- SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection [49.12928389918159]
既存の単分子3D検出器は典型的には、切り離された予測パラダイムを通じて、3D境界ボックスの顕著な非線形回帰をテームする。
本稿では2つの主成分を持つ新しい空間射影アライメント(SPAN)を提案する。
SPANは、予測された3次元境界ボックスと接地した3次元境界ボックスの間に明らかに大域的な空間的制約を課し、それによって非結合な特性回帰による空間的ドリフトを補正する。
3D-2Dプロジェクションアライメントは、投影された3Dボックスが、画像平面上の対応する2D検出バウンディングボックス内に密に整列していることを保証する。
論文 参考訳(メタデータ) (2025-11-10T04:48:48Z) - EA3D: Online Open-World 3D Object Extraction from Streaming Videos [55.48835711373918]
オープンワールド3Dオブジェクト抽出のための統合オンラインフレームワークであるExtractAnything3D(EA3D)を提案する。
ストリーミングビデオが与えられると、EA3Dは視覚言語と2D視覚基盤エンコーダを使用して各フレームを動的に解釈し、オブジェクトレベルの知識を抽出する。
リカレントな共同最適化モジュールは、モデルの関心領域への注意を向け、幾何学的再構成と意味的理解の両面を同時に強化する。
論文 参考訳(メタデータ) (2025-10-29T03:56:41Z) - IGGT: Instance-Grounded Geometry Transformer for Semantic 3D Reconstruction [82.53307702809606]
人間は自然に3次元世界の幾何学的構造と意味的内容を中間次元として知覚する。
本稿では,空間再構成とインスタンスレベルの文脈理解の両面での知識を統合するために,IGGT (InstanceGrounded Geometry Transformer) を提案する。
論文 参考訳(メタデータ) (2025-10-26T14:57:44Z) - Seeing 3D Through 2D Lenses: 3D Few-Shot Class-Incremental Learning via Cross-Modal Geometric Rectification [59.17489431187807]
本稿では,CLIPの階層的空間意味論を活用することで3次元幾何学的忠実度を高めるフレームワークを提案する。
本手法は3次元のクラスインクリメンタル学習を著しく改善し,テクスチャバイアスに対して優れた幾何コヒーレンスとロバスト性を実現する。
論文 参考訳(メタデータ) (2025-09-18T13:45:08Z) - Dens3R: A Foundation Model for 3D Geometry Prediction [44.13431776180547]
Dens3Rは幾何学的密度予測のための3次元基礎モデルである。
画像対マッチング機能と本質的不変性モデリングを統合することにより、Dens3Rは複数の幾何学的量を正確に回帰する。
論文 参考訳(メタデータ) (2025-07-22T07:22:30Z) - Hyper3D: Efficient 3D Representation via Hybrid Triplane and Octree Feature for Enhanced 3D Shape Variational Auto-Encoders [43.61384205458698]
3Dコンテンツ生成パイプラインは、しばしば変分オートエンコーダ(VAE)を利用して、形状をコンパクトな潜在表現にエンコードする。
我々は,ハイブリッド3次元平面とオクツリーを融合した効率的な3次元表現により,VAE再構成を向上するHyper3Dを紹介する。
実験の結果,Hyper3Dは3次元形状を高忠実度で細部まで再現することで従来の表現よりも優れていた。
論文 参考訳(メタデータ) (2025-03-13T14:26:43Z) - LineGS : 3D Line Segment Representation on 3D Gaussian Splatting [0.0]
LineGSは幾何学誘導型3次元ライン再構成と3次元ガウススプラッティングモデルを組み合わせた新しい手法である。
その結果, ベースライン法と比較して, 幾何精度とモデルコンパクト性に有意な改善が認められた。
論文 参考訳(メタデータ) (2024-11-30T13:29:36Z) - A Novel 3D-UNet Deep Learning Framework Based on High-Dimensional
Bilateral Grid for Edge Consistent Single Image Depth Estimation [0.45880283710344055]
3DBG-UNetと呼ばれるバイラテラルグリッドベースの3D畳み込みニューラルネットワークは、UNetsでコンパクトな3D二元格子を符号化することで、高次元の特徴空間をパラメータ化する。
別の新しい3DBGES-UNetモデルは、3DBG-UNetを統合して1つのカラービューの正確な深度マップを推測するものである。
論文 参考訳(メタデータ) (2021-05-21T04:53:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。