論文の概要: OP2GS: Object-Aware 3D Gaussian Splatting with Dual-Opacity Primitives
- arxiv url: http://arxiv.org/abs/2605.20044v1
- Date: Tue, 19 May 2026 16:05:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.508443
- Title: OP2GS: Object-Aware 3D Gaussian Splatting with Dual-Opacity Primitives
- Title(参考訳): OP2GS:Dual-Opacity Primitivesを用いたオブジェクト指向3Dガウススプラッティング
- Authors: Guiyu Liu, Niklas Vaara, Janne Mustaniemi, Juho Kannala, Janne Heikkilä,
- Abstract要約: 3D Splatting (3DGS)は明示的で効率的なシーン表現を提供するが、プリミティブにはオブジェクトレベルのアイデンティティがない。
本稿では,各プリミティブを明示的なインスタンスIDで拡張するオブジェクト認識型ガウス表現OP2GSを提案する。
OP2GSは、計算オーバーヘッドを大幅に削減しつつ、競合するオープン語彙性能を実現する。
- 参考スコア(独自算出の注目度): 18.726262449934147
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D Gaussian Splatting (3DGS) provides an explicit and efficient scene representation, but its primitives lack inherent object-level identity, hindering downstream tasks such as open-vocabulary scene understanding. Existing methods typically address this by either distilling high-dimensional feature embeddings into Gaussians or by lifting 2D mask labels into 3D via heuristic refinement. However, feature-based approaches incur heavy storage and decoding overhead, while lifting-based pipelines remain vulnerable to label contamination: Gaussians necessary for appearance reconstruction often receive incorrect object labels during 2D-to-3D projection. We propose OP2GS, an object-aware Gaussian representation that augments each primitive with an explicit instance identity and a dedicated instance opacity $σ^{*}$ for object-mask rendering. The original opacity $σ$ remains responsible for visual reconstruction, while $σ^{*}$ models whether a Gaussian should contribute to a particular object mask. This dual-opacity formulation decouples visual existence from instance occupancy: mislabeled Gaussians can remain available for image rendering while becoming transparent in the object-mask branch. To learn this representation, we introduce a random object loss that optimizes the 1D instance occupancy field using the standard transmittance-based visibility of 3DGS. Semantic descriptors are then attached at the object level through multi-view aggregation, eliminating per-Gaussian feature storage. Compared with feature-training approaches, OP2GS achieves competitive open-vocabulary performance while significantly reducing computational overhead. Compared with training-free pipelines, it leverages physically consistent occupancy learning to resolve visibility ambiguities.
- Abstract(参考訳): 3D Gaussian Splatting (3DGS)は明示的で効率的なシーン表現を提供するが、プリミティブには固有のオブジェクトレベルのアイデンティティがなく、オープン語彙シーン理解のような下流タスクを妨げる。
既存の方法では、ガウシアンに高次元の特徴を埋め込んだり、2Dマスクラベルをヒューリスティックな精錬によって3Dに上げたりすることで、この問題に対処するのが一般的である。
しかし、機能ベースのアプローチは重いストレージとデコードオーバーヘッドを引き起こし、リフトベースのパイプラインはラベルの汚染に弱いままである。
本稿では,各プリミティブを明示的なインスタンスIDと専用インスタンス不透明度$σ^{*}$で拡張するオブジェクト対応ガウス表現OP2GSを提案する。
元の不透明度$σ$は、視覚的再構成の責任を保ち、$σ^{*}$は、ガウスが特定の対象マスクに寄与するかどうかをモデル化する。
この双対オパシティの定式化は、視覚的存在をインスタンス占有から切り離す。
この表現を学習するために、3DGSの標準的な透過率に基づく可視性を用いて、1Dインスタンス占有領域を最適化するランダムなオブジェクト損失を導入する。
セマンティックディスクリプタは、マルチビューアグリゲーションを通じてオブジェクトレベルでアタッチされ、ガウス単位の機能ストレージがなくなる。
OP2GSは、機能訓練アプローチと比較して、計算オーバーヘッドを大幅に削減しつつ、競合するオープン語彙性能を達成する。
トレーニング不要のパイプラインと比較すると、視界の曖昧さを解決するために、物理的に一貫した占有学習を活用する。
関連論文リスト
- Joint Semantic and Rendering Enhancements in 3D Gaussian Modeling with Anisotropic Local Encoding [86.55824709875598]
本稿では,セマンティックとレンダリングの両方を相乗化する3次元セマンティックガウスモデリングのための統合拡張フレームワークを提案する。
従来の点雲形状符号化とは異なり、細粒度3次元形状を捉えるために異方性3次元ガウシアン・チェビシェフ記述子を導入する。
我々は、学習した形状パターンを継続的に更新するために、クロスシーンの知識伝達モジュールを使用し、より高速な収束と堅牢な表現を可能にします。
論文 参考訳(メタデータ) (2026-01-05T18:33:50Z) - OpenInsGaussian: Open-vocabulary Instance Gaussian Segmentation with Context-aware Cross-view Fusion [89.98812408058336]
textbfOpenInsGaussian, textbfOpen-vocabulary textbfInstance textbfGaussian segmentation framework with Context-aware Cross-view Fusion。
OpenInsGaussianは、オープン語彙の3Dガウスのセグメンテーションにおける最先端の結果を達成し、既存のベースラインを大きなマージンで上回る。
論文 参考訳(メタデータ) (2025-10-21T03:24:12Z) - Beyond Averages: Open-Vocabulary 3D Scene Understanding with Gaussian Splatting and Bag of Embeddings [17.855913571198013]
本稿では,意味論における微分可能レンダリングを完全に回避するパラダイムシフト方式を提案する。
私たちの重要な洞察は、事前分解されたオブジェクトレベルのガウスを利用して、マルチビューCLIP機能アグリゲーションを通じて各オブジェクトを表現することです。
これにより、(1)テキストクエリをオブジェクトレベル(ガウスレベルではない)の埋め込みと比較することにより、正確なオープン語彙オブジェクトの検索が可能となり、(2)シームレスなタスク適応:2次元セグメンテーションや3次元抽出のためのガウスアンにオブジェクトIDを伝搬する。
論文 参考訳(メタデータ) (2025-09-16T10:39:37Z) - LabelGS: Label-Aware 3D Gaussian Splatting for 3D Scene Segmentation [56.4321049923868]
3D Gaussian Splatting (3DGS)は、3Dシーンの新たな明示的な表現として登場し、高忠実度再構成と効率的なレンダリングの両方を提供している。
ガウス表現をオブジェクトラベルで拡張する手法であるラベル対応3Dガウス分割法(LabelGS)を提案する。
LabelGSはFeature-3DGSと比較して、1440X1080の解像度でトレーニングで22倍のスピードアップを達成した。
論文 参考訳(メタデータ) (2025-08-27T09:07:38Z) - Trace3D: Consistent Segmentation Lifting via Gaussian Instance Tracing [27.24794829116753]
ガウススプラッティングにおける2次元視覚分割を3次元に引き上げることの課題に対処する。
既存の方法は、視界を横断する不整合な2Dマスクに悩まされ、うるさいセグメンテーション境界を生成する。
本稿では,標準ガウス表現を入力ビュー全体にわたってインスタンス重み行列で拡張するガウスインスタンス追跡(GIT)を紹介する。
論文 参考訳(メタデータ) (2025-08-05T08:54:17Z) - OVGaussian: Generalizable 3D Gaussian Segmentation with Open Vocabularies [112.80292725951921]
textbfOVGaussianは3D textbfGaussian表現に基づいた、一般化可能なtextbfOpen-textbfVocabulary 3Dセマンティックセマンティックセグメンテーションフレームワークである。
まず,3DGSをベースとした大規模3Dシーンデータセット(textbfSegGaussian)を構築し,ガウス点とマルチビュー画像の両方に対して詳細なセマンティックおよびインスタンスアノテーションを提供する。
シーン間のセマンティック・一般化を促進するために,ジェネリック・セマンティック・ラスタライゼーション(GSR)を導入する。
論文 参考訳(メタデータ) (2024-12-31T07:55:35Z) - Bootstraping Clustering of Gaussians for View-consistent 3D Scene Understanding [59.51535163599723]
FreeGSは、教師なしセマンティック組み込み3DGSフレームワークで、2Dラベルを必要とせずに、ビュー一貫性のある3Dシーン理解を実現する。
FreeGSは複雑なデータ前処理のワークロードを避けながら、最先端のメソッドと互換性がある。
論文 参考訳(メタデータ) (2024-11-29T08:52:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。