論文の概要: TreeGaussian: Tree-Guided Cascaded Contrastive Learning for Hierarchical Consistent 3D Gaussian Scene Segmentation and Understanding
- arxiv url: http://arxiv.org/abs/2604.03309v1
- Date: Tue, 31 Mar 2026 10:22:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.495638
- Title: TreeGaussian: Tree-Guided Cascaded Contrastive Learning for Hierarchical Consistent 3D Gaussian Scene Segmentation and Understanding
- Title(参考訳): TreeGaussian:階層的一貫性を持つ3次元ガウスシーンセグメンテーションと理解のための木誘導カスケードコントラスト学習
- Authors: Jingbin You, Zehao Li, Hao Jiang, Xinzhu Ma, Shuqin Gao, Honglong Zhao, Congcong Zheng, Tianlu Mao, Feng Dai, Yucheng Zhang, Zhaoqi Wang,
- Abstract要約: 木誘導型コントラスト学習フレームワークであるTreeGaussianを紹介する。
マルチレベルオブジェクトツリーを構築することで、TreeGaussianは、オブジェクト-部分階層間の構造化学習を可能にする。
不安定なガウス点を抑えながらビューを整列させるグラフベースのデノナイジングモジュールが導入された。
- 参考スコア(独自算出の注目度): 19.718058183540624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: 3D Gaussian Splatting (3DGS) has emerged as a real-time, differentiable representation for neural scene understanding. However, existing 3DGS-based methods struggle to represent hierarchical 3D semantic structures and capture whole-part relationships in complex scenes. Moreover, dense pairwise comparisons and inconsistent hierarchical labels from 2D priors hinder feature learning, resulting in suboptimal segmentation. To address these limitations, we introduce TreeGaussian, a tree-guided cascaded contrastive learning framework that explicitly models hierarchical semantic relationships and reduces redundancy in contrastive supervision. By constructing a multi-level object tree, TreeGaussian enables structured learning across object-part hierarchies. In addition, we propose a two-stage cascaded contrastive learning strategy that progressively refines feature representations from global to local, mitigating saturation and stabilizing training. A Consistent Segmentation Detection (CSD) mechanism and a graph-based denoising module are further introduced to align segmentation modes across views while suppressing unstable Gaussian points, enhancing segmentation consistency and quality. Extensive experiments, including open-vocabulary 3D object selection, 3D point cloud understanding, and ablation studies, demonstrate the effectiveness and robustness of our approach.
- Abstract(参考訳): 3D Gaussian Splatting(3DGS)は、ニューラルシーン理解のためのリアルタイムで微分可能な表現として登場した。
しかし、既存の3DGSベースの手法は、階層的な3Dセマンティック構造を表現し、複雑な場面で全体的関係を捉えるのに苦労している。
さらに、高密度なペアワイズ比較と2次元先行からの不整合階層ラベルは特徴学習を妨げるため、準最適セグメンテーションが生じる。
このような制約に対処するため,木誘導型コントラスト学習フレームワークであるTreeGaussianを導入する。
マルチレベルオブジェクトツリーを構築することで、TreeGaussianは、オブジェクト-部分階層間の構造化学習を可能にする。
さらに,グローバルな特徴表現から局所的な特徴表現を段階的に洗練し,飽和を緩和し,訓練を安定化する2段階のケースケード型コントラスト学習戦略を提案する。
さらに、不安定なガウス点を抑え、セグメンテーションの整合性と品質を高めつつ、ビューをまたいだセグメンテーションモードを調整するために、一貫性セグメンテーション検出(CSD)機構とグラフベースのデノナイジングモジュールを導入する。
オープンボキャブラリ3Dオブジェクト選択,3Dポイントクラウド理解,アブレーション研究などの大規模な実験は,我々のアプローチの有効性と堅牢性を示している。
関連論文リスト
- UniC-Lift: Unified 3D Instance Segmentation via Contrastive Learning [6.502142457981839]
3D Gaussian Splatting (3DGS) と Neural Radiance Fields (NeRF) は、先進的な新規なビュー合成を行っている。
近年の手法では,多視点2Dセグメンテーションを3Dに拡張し,シーン理解を向上するインスタンス/セグメンテーションを実現している。
主な課題は、ビュー間の2Dインスタンスラベルの不整合である。
本稿では,これらのステップをマージし,トレーニング時間を短縮し,ガウスプリミティブにセグメンテーションを組み込む学習可能な機能を導入することにより,パフォーマンスを向上させる統一フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-31T10:20:01Z) - Binary-Gaussian: Compact and Progressive Representation for 3D Gaussian Segmentation [83.90109373769614]
3D Gaussian Splatting (3D-GS)は効率的な3D表現として登場し、セグメンテーションのようなセグメンテーションタスクのための有望な基盤となっている。
本稿では,各特徴を2進数対決定写像によって1つの整数に圧縮する,ガウス単位のカテゴリ表現のための粗大なバイナリ符号化方式を提案する。
さらに,個別のサブタスクに分割し,クラス間の衝突を減らし,きめ細かいセグメンテーション能力を向上させるプログレッシブトレーニング戦略を設計する。
論文 参考訳(メタデータ) (2025-11-30T15:51:30Z) - Interpretable Single-View 3D Gaussian Splatting using Unsupervised Hierarchical Disentangled Representation Learning [46.85417907244265]
本稿では,粗い3Dセマンティクスと微粒な3Dセマンティクスの両方を発見するために,3DisGSと呼ばれる解釈可能な単一ビュー3DGSフレームワークを提案する。
本モデルでは,高品質かつ高速な再構成を保ちながら3次元のアンタングル化を実現する。
論文 参考訳(メタデータ) (2025-04-05T14:42:13Z) - A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本稿では,2次元監視のみを用いた3次元画像調和拡散モデルの学習フレームワークを提案する。
既存の3D生成モデルは、大規模な3Dデータセットが不足しているため、完全に3Dの監視に依存している。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - Bootstraping Clustering of Gaussians for View-consistent 3D Scene Understanding [59.51535163599723]
FreeGSは、教師なしセマンティック組み込み3DGSフレームワークで、2Dラベルを必要とせずに、ビュー一貫性のある3Dシーン理解を実現する。
FreeGSは複雑なデータ前処理のワークロードを避けながら、最先端のメソッドと互換性がある。
論文 参考訳(メタデータ) (2024-11-29T08:52:32Z) - OmniSeg3D: Omniversal 3D Segmentation via Hierarchical Contrastive
Learning [31.234212614311424]
OmniSeg3Dは,すべてのものを同時に3Dでセグメント化するための全次元セグメント化手法である。
不整合な2Dセグメンテーションによって引き起こされる課題に対処するため、このフレームワークはグローバルな一貫した3D機能フィールドを生み出す。
提案手法が高品質な3次元セグメンテーションと正確な階層構造理解に与える影響を実験により実証した。
論文 参考訳(メタデータ) (2023-11-20T11:04:59Z) - Weakly Supervised Semantic Segmentation in 3D Graph-Structured Point
Clouds of Wild Scenes [36.07733308424772]
3Dセグメンテーションラベルの欠如は、効率的な点雲セグメンテーションの主な障害の1つである。
本稿では,2D のみを監督する点群における大規模セマンティックシーンセグメンテーションのための,新しいディープグラフ畳み込みネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-26T23:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。