論文の概要: Intrinsic 4D Gaussian Segmentation from Scene Cues
- arxiv url: http://arxiv.org/abs/2606.18623v1
- Date: Wed, 17 Jun 2026 02:40:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:50.974405
- Title: Intrinsic 4D Gaussian Segmentation from Scene Cues
- Title(参考訳): シーンクイズからの固有4次元ガウスセグメンテーション
- Authors: Hasan Yazar, Mohamed Rayan Barhdadi, Erchin Serpedin, Mehmet Tuncel, Hasan Kurban,
- Abstract要約: Intrinsic-GSは、ガウス原始体上のスパース親和性グラフを構築する、トレーニングフリーでマスフリーな手法である。
グラフはLeidenコミュニティ検出で分割されており、基礎モデルや学習された機能フィールドを必要としない。
標準的な4Dガウス分割ベンチマークであるNeu3DとHyperNeRFでは、Intrinsic-GSはマスクの監督なしに実質的なオブジェクト構造を復元する。
- 参考スコア(独自算出の注目度): 2.2354043586480414
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Dynamic 4D Gaussian Splatting reconstructs deforming scenes with high fidelity and is increasingly adopted as a representation for dynamic 3D scenes. Putting such a scene to use, for editing, manipulation or motion analysis, first requires segmenting it: grouping the Gaussian primitives into coherent objects. Current pipelines obtain this grouping by importing 2D masks from foundation models such as SAM and lifting or distilling them into the Gaussian representation. In dynamic scenes these masks must be generated across many frames and views, which is costly, and the resulting segmentation can depend strongly on the quality and consistency of those external masks. We ask how much object-level structure can instead be recovered from the Gaussians themselves, and propose Intrinsic-GS, a training-free, mask-free method that builds a sparse affinity graph over Gaussian primitives from appearance, orientation, scale, deformation-trajectory and non-learned rendered-boundary cues. The graph is partitioned with Leiden community detection, requiring no foundation model and no learned feature field. On the standard 4D Gaussian segmentation benchmarks, Neu3D and HyperNeRF, Intrinsic-GS recovers substantial object structure without mask supervision, reaching 0.746 mIoU on Neu3D and 0.575 on HyperNeRF; on Neu3D, a geometry-only variant reaches 0.902 mIoU, matching SAM-supervised TRASE. On HyperNeRF, Intrinsic-GS runs 12.5x faster than the mask-generation and feature-rendering stages used by mask-supervised pipelines. These results suggest that much of the segmentation signal is already encoded in the Gaussians themselves, offering a fast, mask-free direction for 3D and 4D Gaussian segmentation that may also point toward more generalizable, robust segmentation in settings where external masks are unreliable or expensive.
- Abstract(参考訳): ダイナミック4Dガウス・スプレイティングは、高い忠実度を持つデフォーミングシーンを再構築し、ダイナミック3Dシーンの表現としてますます採用されている。
このようなシーンを編集、操作、動作分析に使用するには、まず、ガウス原始体をコヒーレントなオブジェクトにグループ化するというセグメンテーションが必要である。
現在のパイプラインはSAMのような基礎モデルから2Dマスクをインポートし、ガウス表現に引き上げたり蒸留したりすることで、このグループ化を得る。
ダイナミックなシーンでは、これらのマスクは多くのフレームやビューで生成されなければならないが、これはコストがかかり、その結果のセグメンテーションはそれらの外部マスクの品質と一貫性に強く依存する。
Intrinsic-GSは、ガウス原始体を外見、向き、スケール、変形軌道、非学習的有界キューからスパース親和性グラフを構築する訓練自由マスフリーな手法である。
グラフはLeidenコミュニティ検出で分割されており、基礎モデルや学習された機能フィールドを必要としない。
標準的な4Dガウス分割ベンチマークであるNeu3DとHyperNeRFでは、Intrinsic-GSはマスクの監督なしに実質的な物体構造を復元し、Neu3Dは0.746 mIoU、HyperNeRFは0.575 mIoUに達する。
HyperNeRFでは、Intrinsic-GSはマスク生成およびマスク管理パイプラインで使用される機能レンダリングステージよりも12.5倍高速で動作する。
これらの結果は、セグメンテーション信号の多くは既にガウシアン自身に符号化されており、3Dおよび4Dガウシアンセグメンテーションのための高速でマスフリーな方向を提供しており、外部マスクが信頼できない、あるいは高価であるような設定において、より一般化可能で堅牢なセグメンテーションを目指していることを示唆している。
関連論文リスト
- Optimized Minimal 4D Gaussian Splatting [50.29519144753797]
4D Gaussian Splattingは動的シーン表現の新しいパラダイムとして登場し、複雑な動きを持つシーンのリアルタイムレンダリングを可能にした。
何百万人ものガウス人が高忠実度再構築を必要としているため、ストレージオーバーヘッドの大きな課題に直面している。
OMG4は、4次元ガウス模型を忠実に表現できる有能なガウスのコンパクトな集合を構成するフレームワークである。
論文 参考訳(メタデータ) (2025-10-04T16:11:13Z) - SVR-GS: Spatially Variant Regularization for Probabilistic Masks in 3D Gaussian Splatting [26.6636253282757]
本稿では,各ガウスの有効寄与から1ピクセル当たりの空間マスクを線に沿って描画する可変正則化器であるSVR-GSを紹介する。
提案したSVR-GSは、3DGSに比べて1.79(時間)、MaskGSは5.63(時間)、それぞれ0.50dBと0.40dBRの減少しか生じない。
これらのゲインは、ロボット工学、AR/VR、モバイル知覚といったリアルタイムアプリケーションのための、はるかに小さく、より速く、よりメモリ効率の高いモデルに変換される。
論文 参考訳(メタデータ) (2025-09-14T06:08:31Z) - LabelGS: Label-Aware 3D Gaussian Splatting for 3D Scene Segmentation [56.4321049923868]
3D Gaussian Splatting (3DGS)は、3Dシーンの新たな明示的な表現として登場し、高忠実度再構成と効率的なレンダリングの両方を提供している。
ガウス表現をオブジェクトラベルで拡張する手法であるラベル対応3Dガウス分割法(LabelGS)を提案する。
LabelGSはFeature-3DGSと比較して、1440X1080の解像度でトレーニングで22倍のスピードアップを達成した。
論文 参考訳(メタデータ) (2025-08-27T09:07:38Z) - SAGOnline: Segment Any Gaussians Online [17.33447710659887]
3D Gaussian Splatting (3DGS) は、明示的な3Dシーン表現のための強力なパラダイムとして登場した。
現在の手法では, 計算コストの禁止, 空間的推論の制限, 複数物体の同時追跡が困難となっている。
Segment Any Gaussians Online (SAGOnline) はガウスシーンにおけるリアルタイム3Dセグメンテーションのための軽量でゼロショットのフレームワークである。
論文 参考訳(メタデータ) (2025-08-11T17:38:50Z) - PLGS: Robust Panoptic Lifting with 3D Gaussian Splatting [16.333566122541022]
雑音の多い2Dセグメンテーションマスクから3DGSが一貫した単眼セグメンテーションマスクを生成できるPLGSと呼ばれる新しい手法を提案する。
本手法は,従来の最先端手法よりもセグメンテーション品質と速度の両面で優れていた。
論文 参考訳(メタデータ) (2024-10-23T02:05:05Z) - Contrastive Gaussian Clustering: Weakly Supervised 3D Scene Segmentation [14.967600484476385]
本稿では,任意の視点からセグメンテーションマスクを提供する新しいアプローチであるContrastive Gaussian Clusteringを紹介する。
本手法は,不整合な2次元セグメンテーションマスクを用いてトレーニングが可能であり,また,すべてのビューに一貫性のあるセグメンテーションマスクの生成も学べる。
結果のモデルは非常に正確で、予測されたマスクのIoU精度を、最先端で+8%以上向上させる。
論文 参考訳(メタデータ) (2024-04-19T10:47:53Z) - SAGD: Boundary-Enhanced Segment Anything in 3D Gaussian via Gaussian Decomposition [66.56357905500512]
3Dガウススプラッティングは、新しいビュー合成のための代替の3D表現として登場した。
SAGDは3D-GSのための概念的にシンプルで効果的な境界拡張パイプラインである。
提案手法は粗い境界問題なく高品質な3Dセグメンテーションを実現し,他のシーン編集作業にも容易に適用できる。
論文 参考訳(メタデータ) (2024-01-31T14:19:03Z) - Gaussian Grouping: Segment and Edit Anything in 3D Scenes [65.49196142146292]
ガウシアン・グルーピング(ガウシアン・グルーピング)はガウシアン・スプラッティングを拡張して,オープンワールドの3Dシーンで何かを共同で再構築・分割する。
暗黙のNeRF表現と比較すると,グループ化された3次元ガウシアンは,高画質,微粒度,高効率で,あらゆるものを3次元で再構成,分割,編集することができる。
論文 参考訳(メタデータ) (2023-12-01T17:09:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。