論文の概要: Semantic Foam: Unifying Spatial and Semantic Scene Decomposition
- arxiv url: http://arxiv.org/abs/2604.26262v1
- Date: Wed, 29 Apr 2026 03:40:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.242694
- Title: Semantic Foam: Unifying Spatial and Semantic Scene Decomposition
- Title(参考訳): セマンティック・フォーム:空間とセマンティック・シーンの複合化
- Authors: Amr Sharafeldin, Shrisudhan Govindarajan, Thomas Walker, Aryan Mikaeili, Daniel Rebain, Kwang Moo Yi, Andrea Tagliasacchi,
- Abstract要約: 本稿では,最近提案されたRadiant Foam表現を意味分解タスクに拡張したSemantic Foamを紹介する。
提案手法は,ガウスグループやSAGAといった最先端手法と比較して,オブジェクトレベルのセグメンテーション性能が優れている。
- 参考スコア(独自算出の注目度): 38.873957037866965
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern scene reconstruction methods, such as 3D Gaussian Splatting, enable photo-realistic novel view synthesis at real-time speeds. However, their adoption in interactive graphics applications remains limited due to the difficulty of interacting with these representations compared to traditional, human-authored 3D assets. While prior work has attempted to impose semantic decomposition on these models, significant challenges remain in segmentation quality and cross-view consistency.To address these limitations, we introduce Semantic Foam, which extends the recently proposed Radiant Foam representation to semantic decomposition tasks. Our approach leverages the inherent spatial structure of Radiant Foam's volumetric Voronoi mesh and augments it with an explicit semantic feature field defined at the cell level. This design enables direct spatial regularization, improving consistency across views and mitigating artifacts caused by occlusion and inconsistent supervision, which are common issues in point-based representations.Experimental results demonstrate that our method achieves superior object-level segmentation performance compared to state-of-the-art approaches such as Gaussian Grouping and SAGA.Project page: http://semanticfoam.github.io/
- Abstract(参考訳): 3Dガウススプラッティングのような近代的なシーン再構成手法は、リアルタイムに光リアルな新しいビュー合成を可能にする。
しかし、従来の人間による3Dアセットと比較して、これらの表現との相互作用が困難であることから、インタラクティブなグラフィックアプリケーションへの採用は依然として限られている。
これらのモデルにセマンティックな分解を課す試みがあったが、セグメンテーションの品質とクロスビューの整合性には大きな課題が残っており、これらの制限に対処するため、最近提案されたRadiant Foam表現をセマンティックな分解タスクに拡張したSemantic Foamを紹介した。
提案手法は,Radiant Foamの体積Voronoiメッシュの空間構造を利用して,セルレベルで定義された明示的な意味的特徴場を付加する。
提案手法はガウス的グループやSAGAのような最先端のアプローチに比べて,オブジェクトレベルのセグメンテーション性能が優れていることを示す実験結果が得られた。
関連論文リスト
- 3DGS-HPC: Distractor-free 3D Gaussian Splatting with Hybrid Patch-wise Classification [80.43401018217367]
3D Gaussian Splatting (3DGS) は新規なビュー合成と3Dシーン再構成において顕著な性能を示した。
その品質は、移動物体や様々な影など、過渡的な気晴らしによって、現実世界の環境において劣化することが多い。
既存の方法は、事前訓練された視覚モデルから抽出されたセマンティックな手がかりに頼り、これらの障害を識別し、抑制する。
本稿では,2つの相補的原理を組み合わせることで,これらの制約を回避するフレームワークである3DGS-HPCを提案する。
論文 参考訳(メタデータ) (2026-03-08T11:16:30Z) - LVD-GS: Gaussian Splatting SLAM for Dynamic Scenes via Hierarchical Explicit-Implicit Representation Collaboration Rendering [21.615484471658842]
3次元ガウス散乱SLAMは空間知能における高忠実度マッピングの手法として広く用いられている。
既存の手法は、大規模でダイナミックな屋外シーンでの性能を制限する単一の表現方式に依存していることが多い。
我々は,新しいLiDAR-Visual 3D Gaussian Splatting SLAMシステムである textbfLVD-GS を提案する。
論文 参考訳(メタデータ) (2025-10-26T13:16:39Z) - Intern-GS: Vision Model Guided Sparse-View 3D Gaussian Splatting [95.61137026932062]
Intern-GSはスパースビューガウススプラッティングのプロセスを強化する新しいアプローチである。
Intern-GSは多様なデータセットにまたがって最先端のレンダリング品質を実現する。
論文 参考訳(メタデータ) (2025-05-27T05:17:49Z) - CCL-LGS: Contrastive Codebook Learning for 3D Language Gaussian Splatting [53.15827818829865]
2Dプリンシパルに依存しているメソッドは、横断的なセマンティクスの不整合という重要な課題に陥る。
CCL-LGSは、多視点セマンティックキューを統合することで、ビューに一貫性のあるセマンティック監視を実現する新しいフレームワークである。
我々の枠組みは、カテゴリー識別性を維持しながら意味的対立を明示的に解決する。
論文 参考訳(メタデータ) (2025-05-26T19:09:33Z) - Decompositional Neural Scene Reconstruction with Generative Diffusion Prior [64.71091831762214]
完全な形状と詳細なテクスチャを持つ3次元シーンの分解的再構成は、下流の応用に興味深い。
近年のアプローチでは、この問題に対処するために意味的あるいは幾何学的正則化が取り入れられているが、制約の少ない領域では著しく劣化している。
本稿では,SDS(Score Distillation Sampling)の形で拡散先行値を用いたDP-Reconを提案し,新しい視点下で個々の物体の神経表現を最適化する。
論文 参考訳(メタデータ) (2025-03-19T02:11:31Z) - Omni-Scene: Omni-Gaussian Representation for Ego-Centric Sparse-View Scene Reconstruction [9.116550622312362]
自律運転のシナリオでは、より実践的なパラダイムはエゴ中心の再構築であり、最小のクロスビューオーバーラップが特徴である。
本稿では,異なる表現の詳細な分析を行い,ネットワーク設計に適したOmni-Gaussian表現を提案する。
実験の結果,エゴ中心の再構築において,この手法は最先端の手法であるピクセルSplatやMVSplatをはるかに上回ることがわかった。
論文 参考訳(メタデータ) (2024-12-09T07:48:15Z) - GScream: Learning 3D Geometry and Feature Consistent Gaussian Splatting for Object Removal [34.66661937065531]
本稿では,3次元ガウス散乱を用いた放射場更新のために,物体除去の複雑な課題に取り組む。
このタスクの主な課題は、幾何学的一貫性の維持とテクスチャコヒーレンス維持である。
これらの障害を克服するために特別に設計された堅牢なフレームワークを導入します。
論文 参考訳(メタデータ) (2024-04-21T14:42:10Z) - A bioinspired three-stage model for camouflaged object detection [8.11866601771984]
本稿では,1回の繰り返しで粗い部分分割を可能にする3段階モデルを提案する。
本モデルでは, 3つのデコーダを用いて, サブサンプル特徴, 収穫特徴, および高解像度のオリジナル特徴を逐次処理する。
我々のネットワークは、不要な複雑さを伴わずに最先端のCNNベースのネットワークを上回る。
論文 参考訳(メタデータ) (2023-05-22T02:01:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。