論文の概要: R5DGS: Semantic-Aware 4D Gaussian Splatting with Rigid Body Constraints for Efficient Dynamic Scene Reconstruction
- arxiv url: http://arxiv.org/abs/2605.25909v1
- Date: Mon, 25 May 2026 14:46:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.336681
- Title: R5DGS: Semantic-Aware 4D Gaussian Splatting with Rigid Body Constraints for Efficient Dynamic Scene Reconstruction
- Title(参考訳): R5DGS:効率的な動的シーン再構築のための剛体拘束による意味認識型4Dガウス切削
- Authors: Denis Gridusov, Maxim Popov, Sergey Kolyubin,
- Abstract要約: マルチビュービデオからダイナミックな3Dシーンを再構築し、予測することは、ロボティクス、AR/VR、デジタルツインの基本的なタスクである。
近年の物理インフォームドガウシアン・スティング法は, 将来的なフレーム外挿を実現するが, 意味的認識が欠如し, 計算オーバーヘッドが大きい。
物理駆動の 4D ガウス表現をコンパクトな恒等ベクトルで拡張するフレームワークである $textbfR5DGS$ を紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reconstructing and predicting dynamic 3D scenes from multi-view videos is a foundational task for robotics, AR/VR, and digital twins. Recent physics-informed Gaussian Splatting methods achieve impressive future frame extrapolation but lack semantic awareness and suffer from large computational overhead. We introduce $\textbf{R5DGS}$, a framework that augments a physics-driven 4D Gaussian representation with compact Identity Encoding vectors, enabling precise Gaussian-to-object association. By constructing an offline CLIP-based object lookup table, we support open-vocabulary text prompting to retrieve and render object-specific Gaussians across arbitrary timestamps and viewpoints. Furthermore, we propose a rigid-body inference constraint that predicts and integrates physical dynamics exclusively for object centroids, propagating motion to associated Gaussians via relative transformations. This optimization yields a 11 FPS speedup during extrapolation without compromising trajectories plausibility.
- Abstract(参考訳): マルチビュービデオからダイナミックな3Dシーンを再構築し、予測することは、ロボティクス、AR/VR、デジタルツインの基本的なタスクである。
近年の物理インフォームドガウシアン・スティング法は, 将来的なフレーム外挿を実現するが, 意味的認識が欠如し, 計算オーバーヘッドが大きい。
物理駆動の4次元ガウス表現をコンパクトなアイデンティティエンコーディングベクトルで拡張し、正確なガウス対オブジェクトの関連を可能にするフレームワークである$\textbf{R5DGS}$を紹介した。
オフラインのCLIPベースのオブジェクトルックアップテーブルを構築することで、任意のタイムスタンプと視点でオブジェクト固有のガウスを検索および描画するオープン語彙テキストをサポートします。
さらに,物体中心体のみにのみ物理力学を予測・統合する剛体推論制約を提案し,相対変換により関連するガウス運動を伝播する。
この最適化により、軌道の可視性を損なうことなく外挿中の11FPSのスピードアップが得られる。
関連論文リスト
- 3D Skew Gaussian Splatting with Any Camera Trajectory Visualization Engine [10.787069964923754]
3D Skew Gaussian Splatting (3DSGS) は、明示的な表現の構造的忠実性とコンパクト性を大幅に向上させる新しいフレームワークである。
3DSGSは,特に複雑な細部を持つ領域において,流体対話的導出に必要なリアルタイムフレームレートを維持しながら,優れた構造的コンパクト性を実現する。
論文 参考訳(メタデータ) (2026-05-18T12:49:53Z) - EVolSplat4D: Efficient Volume-based Gaussian Splatting for 4D Urban Scene Synthesis [43.898895514609286]
EvolSplat4Dは、ボリュームベースとピクセルベースのガウス予測を統合することで、既存のピクセル単位のパラダイムを超えたフィードフォワードフレームワークである。
EvolSplat4Dは静的環境と動的環境の両方を高い精度と一貫性で再構成し、シーンごとの最適化と最先端のフィードフォワードベースラインの両方に優れることを示す。
論文 参考訳(メタデータ) (2026-01-22T13:39:29Z) - Physics-Informed Deformable Gaussian Splatting: Towards Unified Constitutive Laws for Time-Evolving Material Field [31.2769262836663]
本研究では物理インフォームド・デフォルマブル・ガウス・スティング(PIDG)を提案する。
具体的には,静的非結合な4Dハッシュ符号化を用いて,形状と動きを効率的に再構成する。
さらに、ラグランジアン粒子流とカメラ補償光流とを合わせることでデータの適合を監督し、収束を加速し、一般化を改善する。
論文 参考訳(メタデータ) (2025-11-09T09:35:03Z) - Diff4Splat: Controllable 4D Scene Generation with Latent Dynamic Reconstruction Models [79.06910348413861]
Diff4Splatは、単一の画像から制御可能で明示的な4Dシーンを合成するフィードフォワード方式である。
単一の入力画像、カメラ軌跡、オプションのテキストプロンプトが与えられた場合、Diff4Splatは外見、幾何学、動きを符号化する変形可能な3Dガウス場を直接予測する。
論文 参考訳(メタデータ) (2025-11-01T11:16:25Z) - RaGS: Unleashing 3D Gaussian Splatting from 4D Radar and Monocular Cues for 3D Object Detection [22.546559563539272]
提案するRaGSは,3次元ガウス散乱を利用して4次元レーダとモノクラーキューを融合して3次元物体検出を行うフレームワークである。
RaGSはオブジェクト中心の精度と総合的なシーン認識を実現する。
論文 参考訳(メタデータ) (2025-07-26T08:17:12Z) - Speedy Deformable 3D Gaussian Splatting: Fast Rendering and Compression of Dynamic Scenes [57.69608119350651]
動的シーンへの3次元ガウススティング(3DGS)の最近の拡張は、ニューラルネットワークを用いて各ガウスの時間変化変形を予測することによって、高品質な新規ビュー合成を実現する。
しかしながら、ガウス毎のニューラルネットワークを各フレームで実行することは、レンダリング速度を制限し、メモリと計算要求を増大させる、重大なボトルネックとなる。
動的3DGSおよび4DGS表現のレンダリング速度を2つの相補的手法により低減し,高速化する汎用パイプラインであるSpeedy Deformable 3D Gaussian Splatting(SpeeDe3DGS)を提案する。
論文 参考訳(メタデータ) (2025-06-09T16:30:48Z) - DeSiRe-GS: 4D Street Gaussians for Static-Dynamic Decomposition and Surface Reconstruction for Urban Driving Scenes [71.61083731844282]
本稿では,自己教師型ガウススプラッティング表現であるDeSiRe-GSについて述べる。
複雑な駆動シナリオにおいて、効率的な静的・動的分解と高忠実な表面再構成を可能にする。
論文 参考訳(メタデータ) (2024-11-18T05:49:16Z) - Align Your Gaussians: Text-to-4D with Dynamic 3D Gaussians and Composed
Diffusion Models [94.07744207257653]
我々は、探索されていないテキストから4D設定に焦点をあて、動的にアニメーションされた3Dオブジェクトを合成する。
4次元オブジェクト最適化において,テキスト・ツー・イメージ,テキスト・ツー・ビデオ,および3次元認識型多視点拡散モデルを組み合わせてフィードバックを提供する。
論文 参考訳(メタデータ) (2023-12-21T11:41:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。