Fugu-MT 論文翻訳(概要): UrbanGS: Semantic-Guided Gaussian Splatting for Urban Scene Reconstruction

論文の概要: UrbanGS: Semantic-Guided Gaussian Splatting for Urban Scene Reconstruction

arxiv url: http://arxiv.org/abs/2412.03473v2
Date: Fri, 21 Mar 2025 10:30:57 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-24 15:40:09.8482
Title: UrbanGS: Semantic-Guided Gaussian Splatting for Urban Scene Reconstruction
Title（参考訳）: UrbanGS:Semantic-Guided Gaussian Splatting for Urban Scene Reconstruction
Authors: Ziwen Li, Jiaxin Huang, Runnan Chen, Yunlong Che, Yandong Guo, Tongliang Liu, Fakhri Karray, Mingming Gong,
Abstract要約: UrbanGSは2Dセマンティックマップと既存の動的ガウスアプローチを使って静的オブジェクトとシーンを区別する。動的オブジェクトに対して、学習可能な時間埋め込みを用いて時間情報を集約する。提案手法は, 修復の質と効率性において, 最先端の手法より優れている。
参考スコア（独自算出の注目度）: 86.4386398262018
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Reconstructing urban scenes is challenging due to their complex geometries and the presence of potentially dynamic objects. 3D Gaussian Splatting (3DGS)-based methods have shown strong performance, but existing approaches often incorporate manual 3D annotations to improve dynamic object modeling, which is impractical due to high labeling costs. Some methods leverage 4D Gaussian Splatting (4DGS) to represent the entire scene, but they treat static and dynamic objects uniformly, leading to unnecessary updates for static elements and ultimately degrading reconstruction quality. To address these issues, we propose UrbanGS, which leverages 2D semantic maps and an existing dynamic Gaussian approach to distinguish static objects from the scene, enabling separate processing of definite static and potentially dynamic elements. Specifically, for definite static regions, we enforce global consistency to prevent unintended changes in dynamic Gaussian and introduce a K-nearest neighbor (KNN)-based regularization to improve local coherence on low-textured ground surfaces. Notably, for potentially dynamic objects, we aggregate temporal information using learnable time embeddings, allowing each Gaussian to model deformations over time. Extensive experiments on real-world datasets demonstrate that our approach outperforms state-of-the-art methods in reconstruction quality and efficiency, accurately preserving static content while capturing dynamic elements.
Abstract（参考訳）: 複雑な地形と潜在的にダイナミックな物体の存在のため、都市景観の再構築は困難である。 3D Gaussian Splatting(3DGS)ベースの手法は高い性能を示してきたが、既存の手法では動的オブジェクトモデリングを改善するために手動の3Dアノテーションが組み込まれており、これは高ラベリングコストのため実用的ではない。シーン全体を表すために4D Gaussian Splatting (4DGS) を利用する方法もあるが、静的および動的オブジェクトを均一に扱い、静的要素の不要な更新と最終的に再構築品質の低下につながる。これらの問題に対処するために,2Dセマンティックマップと既存の動的ガウスアプローチを活用して静的な物体とシーンを区別し,一定の静的要素と潜在的動的要素の分離処理を可能にするUrbanGSを提案する。具体的には, 一定の静的領域に対して, 動的ガウスの意図しない変化を防止し, 低テクスチャ面上の局所コヒーレンスを改善するために, K-nearest neighbor (KNN) ベースの正規化を導入する。特に、潜在的に動的対象に対して、学習可能な時間埋め込みを用いて時間情報を集約し、各ガウスが時間とともに変形をモデル化できるようにする。実世界のデータセットに対する大規模な実験により、我々の手法は、動的要素を捕捉しながら静的コンテンツを正確に保存し、再現の質と効率において最先端の手法よりも優れていることを示した。

関連論文リスト

DGS-LRM: Real-Time Deformable 3D Gaussian Reconstruction From Monocular Videos [52.46386528202226]
Deformable Gaussian Splats Large Reconstruction Model (DGS-LRM)を紹介する。動的シーンのモノクロポーズビデオから変形可能な3Dガウススプラットを予測する最初のフィードフォワード法である。最先端のモノクロビデオ3D追跡手法と同等の性能を発揮する。
論文参考訳（メタデータ） (2025-06-11T17:59:58Z)
Embracing Dynamics: Dynamics-aware 4D Gaussian Splatting SLAM [0.0]
D4DGS-SLAMは動的環境のための4DGSマップ表現に基づく最初のSLAMである。時間次元をシーン表現に組み込むことで、D4DGS-SLAMは動的シーンの高品質な再構成を可能にする。提案手法は,カメラのポーズトラッキングとマップの品質の両方において,最先端の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-04-07T08:56:35Z)
SDD-4DGS: Static-Dynamic Aware Decoupling in Gaussian Splatting for 4D Scene Reconstruction [21.822062121612166]
SDD-4DGSは、ガウススプラッティングに基づく4次元シーン再構成のための最初のフレームワークである。提案手法は,ガウス再建パイプラインに自然に統合された確率論的動的知覚係数に基づく。 5つのベンチマークデータセットの実験により、SDD-4DGSは復元忠実度において最先端の手法を一貫して上回っていることが示された。
論文参考訳（メタデータ） (2025-03-12T12:25:58Z)
T-3DGS: Removing Transient Objects for 3D Scene Reconstruction [83.05271859398779]
映像シーケンスにおける過渡的オブジェクトは、3Dシーン再構成の品質を著しく低下させる可能性がある。我々は,ガウススプラッティングを用いた3次元再構成において,過渡的障害を頑健に除去する新しいフレームワークT-3DGSを提案する。
論文参考訳（メタデータ） (2024-11-29T07:45:24Z)
Event-boosted Deformable 3D Gaussians for Dynamic Scene Reconstruction [50.873820265165975]
本稿では,高時間分解能連続運動データと動的シーン再構成のための変形可能な3D-GSを併用したイベントカメラについて紹介する。本稿では、3次元再構成としきい値モデリングの両方を大幅に改善する相互強化プロセスを作成するGS-Thresholdジョイントモデリング戦略を提案する。提案手法は,合成および実世界の動的シーンを用いた最初のイベント包摂型4Dベンチマークであり,その上で最先端の性能を実現する。
論文参考訳（メタデータ） (2024-11-25T08:23:38Z)
DeSiRe-GS: 4D Street Gaussians for Static-Dynamic Decomposition and Surface Reconstruction for Urban Driving Scenes [71.61083731844282]
本稿では,自己教師型ガウススプラッティング表現であるDeSiRe-GSについて述べる。複雑な駆動シナリオにおいて、効率的な静的・動的分解と高忠実な表面再構成を可能にする。
論文参考訳（メタデータ） (2024-11-18T05:49:16Z)
DENSER: 3D Gaussians Splatting for Scene Reconstruction of Dynamic Urban Environments [0.0]
動的オブジェクトの表現を大幅に強化するフレームワークであるDENSERを提案する。提案手法は最先端の手法を広いマージンで大幅に上回る。
論文参考訳（メタデータ） (2024-09-16T07:11:58Z)
Gaussian Splatting LK [0.11249583407496218]
本稿では,動的ガウススティングフレームワークにおけるネイティブワープフィールドの正規化の可能性について検討する。フォワードワープフィールドネットワークに固有の知識を利用して解析速度場を導出できることが示される。このルーカス・カナーデ型解析正規化により,高ダイナミックなシーンを再構成する際の優れた性能を実現することができる。
論文参考訳（メタデータ） (2024-07-16T01:50:43Z)
Dynamic 3D Gaussian Fields for Urban Areas [60.64840836584623]
大規模でダイナミックな都市部における新規ビュー合成(NVS)のための効率的なニューラル3Dシーン表現法を提案する。本研究では,大規模都市にスケールするニューラルネットワークシーン表現である4DGFを提案する。
論文参考訳（メタデータ） (2024-06-05T12:07:39Z)
HUGS: Holistic Urban 3D Scene Understanding via Gaussian Splatting [53.6394928681237]
RGB画像に基づく都市景観の全体的理解は、難しいが重要な問題である。我々の主な考え方は、静的な3Dガウスと動的なガウスの組合せを用いた幾何学、外観、意味論、運動の合同最適化である。提案手法は,2次元および3次元のセマンティック情報を高精度に生成し,新たな視点をリアルタイムに描画する機能を提供する。
論文参考訳（メタデータ） (2024-03-19T13:39:05Z)
Periodic Vibration Gaussian: Dynamic Urban Scene Reconstruction and Real-time Rendering [36.111845416439095]
周期振動ガウスモデル(PVG)を提案する。 PVGは、当初静的シーン表現のために設計された効率的な3Dガウススプラッティング技術に基づいている。 PVGは、最良の代替品よりも900倍の速度でレンダリングできる。
論文参考訳（メタデータ） (2023-11-30T13:53:50Z)
EmerNeRF: Emergent Spatial-Temporal Scene Decomposition via Self-Supervision [85.17951804790515]
EmerNeRFは動的駆動シーンの時空間表現を学習するためのシンプルだが強力なアプローチである。シーンの幾何学、外観、動き、セマンティクスを自己ブートストラップで同時にキャプチャする。本手法はセンサシミュレーションにおける最先端性能を実現する。
論文参考訳（メタデータ） (2023-11-03T17:59:55Z)
Dynamic 3D Gaussians: Tracking by Persistent Dynamic View Synthesis [58.5779956899918]
動的シーンビュー合成と6自由度(6-DOF)追跡のタスクを同時に処理する手法を提案する。我々は、シーンを3Dガウスアンのコレクションとしてモデル化する最近の研究に触発された、分析バイシンセサイザーの枠組みに従う。我々は,1人称視点合成,動的合成シーン合成,4次元映像編集など,我々の表現によって実現された多数のダウンストリームアプリケーションを紹介した。
論文参考訳（メタデータ） (2023-08-18T17:59:21Z)
LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human Modeling [69.56581851211841]
そこで我々は,LoRDという,動的に衣を着る人間の局所的な4D暗黙表現を提案する。私たちの重要な洞察は、ネットワークがローカルな部分レベルの表現の潜在コードを学ぶように促すことです。 LoRDは、4D人間を表現する能力が強く、実用上の最先端の手法よりも優れています。
論文参考訳（メタデータ） (2022-08-18T03:49:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。