論文の概要: Semantic Foam: Unifying Spatial and Semantic Scene Decomposition
- arxiv url: http://arxiv.org/abs/2604.26262v2
- Date: Fri, 01 May 2026 06:13:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 13:37:10.921269
- Title: Semantic Foam: Unifying Spatial and Semantic Scene Decomposition
- Title(参考訳): セマンティック・フォーム:空間とセマンティック・シーンの複合化
- Authors: Amr Sharafeldin, Shrisudhan Govindarajan, Thomas Walker, Aryan Mikaeili, Daniel Rebain, Kwang Moo Yi, Andrea Tagliasacchi,
- Abstract要約: 我々はSemantic Foamを導入し、最近提案されたRadiant Foam表現を意味分解タスクに拡張する。
提案手法は,Radiant Foam's Voronoi メッシュの自然体積分解とセルレベルでパラメータ化された明示的な意味的特徴場を統合する。
実験の結果,ガウスグループやSAGAのような最先端の手法と比較して,オブジェクトレベルのセグメンテーション性能が優れていることがわかった。
- 参考スコア(独自算出の注目度): 38.873957037866965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern scene reconstruction methods, such as 3D Gaussian Splatting, deliver photo-realistic novel view synthesis at real-time speeds, yet their adoption in interactive graphics applications has been limited. A major bottleneck is the difficulty of interacting with these representations compared to traditional, human-authored 3D assets. While previous research has attempted to impose semantic decomposition on these models, significant challenges remain regarding segmentation quality and consistency. To address this, we introduce Semantic Foam, extending the recently proposed Radiant Foam representations to semantic decomposition tasks. Our approach integrates the natural spatial volumetric decomposition of Radiant Foam's Voronoi mesh with an explicit semantic feature field parameterized at the cell level. This explicit structure enables direct spatial regularization, which prevents artifacts caused by occlusion or inconsistent supervision across views - common pitfalls for other point-based representations. Experimental results show that our method achieves superior object-level segmentation performance compared to state-of-the-art methods like Gaussian Grouping and SAGA.
- Abstract(参考訳): 3D Gaussian Splattingのような現代のシーン再構成手法は、リアルタイムに写真リアリスティックな新しいビュー合成を提供するが、インタラクティブなグラフィックアプリケーションでは採用が限られている。
主なボトルネックは、従来の人間による3Dアセットと比較して、これらの表現と対話することの難しさである。
以前の研究ではこれらのモデルに意味論的分解を課す試みがあったが、セグメンテーションの品質と一貫性に関して重要な課題が残っている。
そこで本研究では,最近提案されたRadiant Foam表現を意味分解タスクに拡張したSemantic Foamを紹介する。
提案手法は,Radiant Foam's Voronoi メッシュの自然空間体積分解とセルレベルでパラメータ化された明示的意味的特徴場を統合する。
この明示的な構造は、直接的な空間規則化を可能にし、他の点ベースの表現に共通する落とし穴である、ビュー間の閉塞や一貫性のない監視によって生じるアーティファクトを防止する。
実験の結果,ガウスグループやSAGAのような最先端の手法と比較して,オブジェクトレベルのセグメンテーション性能が優れていることがわかった。
関連論文リスト
- 3DGS-HPC: Distractor-free 3D Gaussian Splatting with Hybrid Patch-wise Classification [80.43401018217367]
3D Gaussian Splatting (3DGS) は新規なビュー合成と3Dシーン再構成において顕著な性能を示した。
その品質は、移動物体や様々な影など、過渡的な気晴らしによって、現実世界の環境において劣化することが多い。
既存の方法は、事前訓練された視覚モデルから抽出されたセマンティックな手がかりに頼り、これらの障害を識別し、抑制する。
本稿では,2つの相補的原理を組み合わせることで,これらの制約を回避するフレームワークである3DGS-HPCを提案する。
論文 参考訳(メタデータ) (2026-03-08T11:16:30Z) - LVD-GS: Gaussian Splatting SLAM for Dynamic Scenes via Hierarchical Explicit-Implicit Representation Collaboration Rendering [21.615484471658842]
3次元ガウス散乱SLAMは空間知能における高忠実度マッピングの手法として広く用いられている。
既存の手法は、大規模でダイナミックな屋外シーンでの性能を制限する単一の表現方式に依存していることが多い。
我々は,新しいLiDAR-Visual 3D Gaussian Splatting SLAMシステムである textbfLVD-GS を提案する。
論文 参考訳(メタデータ) (2025-10-26T13:16:39Z) - Intern-GS: Vision Model Guided Sparse-View 3D Gaussian Splatting [95.61137026932062]
Intern-GSはスパースビューガウススプラッティングのプロセスを強化する新しいアプローチである。
Intern-GSは多様なデータセットにまたがって最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2025-05-27T05:17:49Z) - CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting [53.15827818829865]
2Dプリンシパルに依存しているメソッドは、横断的なセマンティクスの不整合という重要な課題に陥る。
CCL-LGSは、多視点セマンティックキューを統合することで、ビューに一貫性のあるセマンティック監視を実現する新しいフレームワークである。
我々の枠組みは、カテゴリー識別性を維持しながら意味的対立を明示的に解決する。
論文 参考訳(メタデータ) (2025-05-26T19:09:33Z) - Decompositional Neural Scene Reconstruction with Generative Diffusion Prior [64.71091831762214]
完全な形状と詳細なテクスチャを持つ3次元シーンの分解的再構成は、下流の応用に興味深い。
近年のアプローチでは、この問題に対処するために意味的あるいは幾何学的正則化が取り入れられているが、制約の少ない領域では著しく劣化している。
本稿では,SDS(Score Distillation Sampling)の形で拡散先行値を用いたDP-Reconを提案し,新しい視点下で個々の物体の神経表現を最適化する。
論文 参考訳(メタデータ) (2025-03-19T02:11:31Z) - Omni-Scene: Omni-Gaussian Representation for Ego-Centric Sparse-View Scene Reconstruction [9.116550622312362]
自律運転のシナリオでは、より実践的なパラダイムはエゴ中心の再構築であり、最小のクロスビューオーバーラップが特徴である。
本稿では,異なる表現の詳細な分析を行い,ネットワーク設計に適したOmni-Gaussian表現を提案する。
実験の結果,エゴ中心の再構築において,この手法は最先端の手法であるピクセルSplatやMVSplatをはるかに上回ることがわかった。
論文 参考訳(メタデータ) (2024-12-09T07:48:15Z) - GScream: Learning 3D Geometry and Feature Consistent Gaussian Splatting for Object Removal [34.66661937065531]
本稿では,3次元ガウス散乱を用いた放射場更新のために,物体除去の複雑な課題に取り組む。
このタスクの主な課題は、幾何学的一貫性の維持とテクスチャコヒーレンス維持である。
これらの障害を克服するために特別に設計された堅牢なフレームワークを導入します。
論文 参考訳(メタデータ) (2024-04-21T14:42:10Z) - A bioinspired three-stage model for camouflaged object detection [8.11866601771984]
本稿では,1回の繰り返しで粗い部分分割を可能にする3段階モデルを提案する。
本モデルでは, 3つのデコーダを用いて, サブサンプル特徴, 収穫特徴, および高解像度のオリジナル特徴を逐次処理する。
我々のネットワークは、不要な複雑さを伴わずに最先端のCNNベースのネットワークを上回る。
論文 参考訳(メタデータ) (2023-05-22T02:01:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。