論文の概要: UniC-Lift: Unified 3D Instance Segmentation via Contrastive Learning
- arxiv url: http://arxiv.org/abs/2512.24763v1
- Date: Wed, 31 Dec 2025 10:20:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.620941
- Title: UniC-Lift: Unified 3D Instance Segmentation via Contrastive Learning
- Title(参考訳): UniC-Lift: コントラスト学習による統一3次元インスタンスセグメンテーション
- Authors: Ankit Dhiman, Srinath R, Jaswanth Reddy, Lokesh R Boregowda, Venkatesh Babu Radhakrishnan,
- Abstract要約: 3D Gaussian Splatting (3DGS) と Neural Radiance Fields (NeRF) は、先進的な新規なビュー合成を行っている。
近年の手法では,多視点2Dセグメンテーションを3Dに拡張し,シーン理解を向上するインスタンス/セグメンテーションを実現している。
主な課題は、ビュー間の2Dインスタンスラベルの不整合である。
本稿では,これらのステップをマージし,トレーニング時間を短縮し,ガウスプリミティブにセグメンテーションを組み込む学習可能な機能を導入することにより,パフォーマンスを向上させる統一フレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.502142457981839
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: 3D Gaussian Splatting (3DGS) and Neural Radiance Fields (NeRF) have advanced novel-view synthesis. Recent methods extend multi-view 2D segmentation to 3D, enabling instance/semantic segmentation for better scene understanding. A key challenge is the inconsistency of 2D instance labels across views, leading to poor 3D predictions. Existing methods use a two-stage approach in which some rely on contrastive learning with hyperparameter-sensitive clustering, while others preprocess labels for consistency. We propose a unified framework that merges these steps, reducing training time and improving performance by introducing a learnable feature embedding for segmentation in Gaussian primitives. This embedding is then efficiently decoded into instance labels through a novel "Embedding-to-Label" process, effectively integrating the optimization. While this unified framework offers substantial benefits, we observed artifacts at the object boundaries. To address the object boundary issues, we propose hard-mining samples along these boundaries. However, directly applying hard mining to the feature embeddings proved unstable. Therefore, we apply a linear layer to the rasterized feature embeddings before calculating the triplet loss, which stabilizes training and significantly improves performance. Our method outperforms baselines qualitatively and quantitatively on the ScanNet, Replica3D, and Messy-Rooms datasets.
- Abstract(参考訳): 3D Gaussian Splatting (3DGS) と Neural Radiance Fields (NeRF) は、先進的な新規なビュー合成を行っている。
近年の手法では,多視点2Dセグメンテーションを3Dに拡張し,シーン理解を向上するインスタンス/セグメンテーションを実現している。
重要な課題は、ビュー間の2Dインスタンスラベルの不整合である。
既存の手法では、2段階のアプローチを採用しており、一部はハイパーパラメータに敏感なクラスタリングによる対照的な学習に依存し、他方は一貫性のための前処理ラベルを使用する。
本稿では,これらのステップをマージし,トレーニング時間を短縮し,ガウスプリミティブにセグメンテーションを組み込む学習可能な機能を導入することにより,パフォーマンスを向上させる統一フレームワークを提案する。
この埋め込みは、新しい"Embedding-to-Label"プロセスを通じて、効率的にインスタンスラベルにデコードされ、最適化を効果的に統合する。
この統合されたフレームワークには大きなメリットがありますが、私たちはオブジェクト境界におけるアーティファクトを観察しました。
オブジェクト境界問題に対処するため、これらの境界に沿ってハードマイニングサンプルを提案する。
しかし、機能埋め込みに直接ハードマイニングを適用すると不安定であることが判明した。
そこで, 3重項損失を計算する前に, ラスタ化特徴埋め込みに線形層を適用し, トレーニングを安定させ, 性能を著しく向上させる。
提案手法は,ScanNet,Replica3D,Messy-Roomsのデータセットに基づいて,定性的,定量的にベースラインを上回ります。
関連論文リスト
- Class-agnostic 3D Segmentation by Granularity-Consistent Automatic 2D Mask Tracking [10.223105883919278]
本稿では,フレーム間の時間的対応を維持する2次元マスク追跡手法を提案する。
本手法は, 整合性および高精度な3次元セグメンテーションを効果的に生成する。
論文 参考訳(メタデータ) (2025-11-02T03:52:42Z) - ALISE: Annotation-Free LiDAR Instance Segmentation for Autonomous Driving [9.361724251990154]
アノテーションなしでLiDARインスタンスセグメンテーションを実行する新しいフレームワークであるALISEを紹介する。
我々のアプローチは、テキストと画像でガイドされたビジョンファウンデーションモデル(VFM)を用いて、初期の擬似ラベルを生成することから始まります。
そして、これらのラベルを、オフラインとオンラインの両方の最適化のために2Dと3Dのセマンティクスを組み合わせた専用の手動時間投票モジュールで洗練します。
この包括的な設計により、パフォーマンスが大幅に向上し、教師なしの3Dインスタンスセグメンテーションのための新しい最先端技術が確立される。
論文 参考訳(メタデータ) (2025-10-07T10:15:18Z) - Rethinking End-to-End 2D to 3D Scene Segmentation in Gaussian Splatting [86.15347226865826]
We design an new end-to-end object-aware lifting approach, called Unified-Lift。
コントラスト損失を用いて学習したガウスレベルの機能を各ガウス点に拡張し、インスタンス情報をエンコードする。
LERF-Masked、Replica、Messy Roomsの3つのベンチマークで実験を行った。
論文 参考訳(メタデータ) (2025-03-18T08:42:23Z) - Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - Towards Modality-agnostic Label-efficient Segmentation with Entropy-Regularized Distribution Alignment [62.73503467108322]
この話題は、3次元の点雲のセグメンテーションで広く研究されている。
近年まで、擬似ラベルは、限られた地道ラベルによる訓練を容易にするために広く用いられてきた。
既存の擬似ラベリングアプローチは、重複しないデータのノイズやバリエーションに悩まされる可能性がある。
本研究では,学習用擬似ラベルを正規化し,擬似ラベルとモデル予測とのギャップを効果的に狭める学習戦略を提案する。
論文 参考訳(メタデータ) (2024-08-29T13:31:15Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。