論文の概要: Pointmap Association and Piecewise-Plane Constraint for Consistent and Compact 3D Gaussian Segmentation Field
- arxiv url: http://arxiv.org/abs/2502.16303v1
- Date: Sat, 22 Feb 2025 17:23:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:54:22.647487
- Title: Pointmap Association and Piecewise-Plane Constraint for Consistent and Compact 3D Gaussian Segmentation Field
- Title(参考訳): 連続かつコンパクトな3次元ガウスセグメンテーション場のための点マップアソシエーションとピースワイズ・プレーン制約
- Authors: Wenhao Hu, Wenhao Chai, Shengyu Hao, Xiaotong Cui, Xuexiang Wen, Jenq-Neng Hwang, Gaoang Wang,
- Abstract要約: CCGSは、ビュー一貫性のある2Dセグメンテーションとコンパクトな3Dガウスセグメンテーションの両方を実現するために設計された手法である。
ScanNetとReplicaのデータセットの実験結果から、CCGSは2Dパノプティカルセグメンテーションと3Dガウスセグメンテーションの両方において既存の手法より優れていることが示された。
- 参考スコア(独自算出の注目度): 24.145668344380766
- License:
- Abstract: Achieving a consistent and compact 3D segmentation field is crucial for maintaining semantic coherence across views and accurately representing scene structures. Previous 3D scene segmentation methods rely on video segmentation models to address inconsistencies across views, but the absence of spatial information often leads to object misassociation when object temporarily disappear and reappear. Furthermore, in the process of 3D scene reconstruction, segmentation and optimization are often treated as separate tasks. As a result, optimization typically lacks awareness of semantic category information, which can result in floaters with ambiguous segmentation. To address these challenges, we introduce CCGS, a method designed to achieve both view consistent 2D segmentation and a compact 3D Gaussian segmentation field. CCGS incorporates pointmap association and a piecewise-plane constraint. First, we establish pixel correspondence between adjacent images by minimizing the Euclidean distance between their pointmaps. We then redefine object mask overlap accordingly. The Hungarian algorithm is employed to optimize mask association by minimizing the total matching cost, while allowing for partial matches. To further enhance compactness, the piecewise-plane constraint restricts point displacement within local planes during optimization, thereby preserving structural integrity. Experimental results on ScanNet and Replica datasets demonstrate that CCGS outperforms existing methods in both 2D panoptic segmentation and 3D Gaussian segmentation.
- Abstract(参考訳): 連続的でコンパクトな3Dセグメンテーションフィールドを実現することは、ビュー間のセマンティックコヒーレンスを維持し、シーン構造を正確に表現するために重要である。
従来の3Dシーンセグメンテーション手法は、ビュー間の不整合に対処するためにビデオセグメンテーションモデルに頼っていたが、空間情報の欠如は、オブジェクトが一時的に消えて再び現れると、オブジェクトの誤結合につながることが多い。
さらに,3次元シーン再構成では,セグメント化と最適化が別々のタスクとして扱われることが多い。
その結果、最適化は通常意味圏情報の認識を欠いているため、不明瞭なセグメンテーションを持つフローターが生まれる。
これらの課題に対処するため、CCGSは、ビュー整合性2次元セグメンテーションとコンパクトな3次元ガウスセグメンテーションの両方を実現するために設計された手法である。
CCGSは、ポイントマップアソシエーションと片面の制約を取り入れている。
まず,各点間のユークリッド距離を最小化することにより,隣接画像間の画素対応性を確立する。
その後、オブジェクトマスクの重複を再定義します。
ハンガリーのアルゴリズムは、全体のマッチングコストを最小化し、部分一致を許容することでマスクアソシエーションを最適化するために使用される。
さらにコンパクト性を高めるため、片側平面の制約は最適化中の局所平面内の点変位を制限し、構造的整合性を維持する。
ScanNetとReplicaのデータセットの実験結果から、CCGSは2Dパノプティカルセグメンテーションと3Dガウスセグメンテーションの両方において既存の手法より優れていることが示された。
関連論文リスト
- 3D Part Segmentation via Geometric Aggregation of 2D Visual Features [57.20161517451834]
監督された3D部分分割モデルは、固定されたオブジェクトと部品のセットに合わせて調整されており、それらの転送可能性は、オープンセットの現実世界のシナリオに制限される。
近年、視覚言語モデル(VLM)を多視点レンダリングとテキストプロンプトを用いてオブジェクト部品の識別に活用する研究が進められている。
これらの制約に対処するために,視覚概念から抽出した意味論と3次元幾何学をブレンドし,対象部品を効果的に同定するCOPSを提案する。
論文 参考訳(メタデータ) (2024-12-05T15:27:58Z) - Bootstraping Clustering of Gaussians for View-consistent 3D Scene Understanding [59.51535163599723]
FreeGSは、教師なしセマンティック組み込み3DGSフレームワークで、2Dラベルを必要とせずに、ビュー一貫性のある3Dシーン理解を実現する。
我々は、FreeGSが複雑なデータ前処理作業の負荷を回避しつつ、最先端のメソッドと互換性があることを示す。
論文 参考訳(メタデータ) (2024-11-29T08:52:32Z) - View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.08335264414515]
我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文 参考訳(メタデータ) (2024-05-30T04:14:58Z) - PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic
Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。
また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。
プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文 参考訳(メタデータ) (2023-08-31T17:57:17Z) - SwIPE: Efficient and Robust Medical Image Segmentation with Implicit Patch Embeddings [12.79344668998054]
正確な局所境界線とグローバルな形状コヒーレンスを実現するために,SwIPE(Segmentation with Implicit Patch Embeddings)を提案する。
その結果,最近の暗黙的アプローチよりもSwIPEは大幅に改善され,パラメータが10倍以上の最先端の離散手法よりも優れていた。
論文 参考訳(メタデータ) (2023-07-23T20:55:11Z) - Structural Multiplane Image: Bridging Neural View Synthesis and 3D
Reconstruction [39.89856628467095]
平面構造が3次元シーンを簡潔に近似する構造的MPI(S-MPI)を導入する。
S-MPIを適用するという直感と要求にもかかわらず、RGBA層と平面の両方の高忠実度近似のような大きな課題が導入されている。
提案手法は,従来のMPIを用いたビュー合成法と平面再構成法より優れていた。
論文 参考訳(メタデータ) (2023-03-10T14:18:40Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Sparse Cross-scale Attention Network for Efficient LiDAR Panoptic
Segmentation [12.61753274984776]
マルチスケールのスパース機能とグローバルなボクセル符号化されたアテンションを整合させて、インスタンスコンテキストの長距離関係をキャプチャする、新しいスパース・クロススケールアテンション・ネットワークであるSCANを提案する。
表面凝集点に対して、SCANは、整列した特徴の空間性を維持するだけでなく、スパース畳み込みによってネットワークの量を減少させる、新しいスパースクラス非依存のインスタンスセントロイド表現を採用する。
論文 参考訳(メタデータ) (2022-01-16T05:34:54Z) - PointFlow: Flowing Semantics Through Points for Aerial Image
Segmentation [96.76882806139251]
本論文では,FPN(Feature Pyramid Network)フレームワークに基づく点親和性伝播モジュールであるPointFlowを提案する。
密接な親和性学習ではなく、隣接する特徴間の選択された点にスパース親和性マップを生成する。
3つの異なる空中セグメンテーションデータセットの実験結果から,提案手法は最先端の汎用セグメンテーション法よりも効率的かつ効率的であることが示唆された。
論文 参考訳(メタデータ) (2021-03-11T09:42:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。