論文の概要: Liquid Neural Networks as a Drop-in Continuous-Time Deformation Field for Dynamic 3D Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2606.07670v1
- Date: Thu, 04 Jun 2026 08:43:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.262064
- Title: Liquid Neural Networks as a Drop-in Continuous-Time Deformation Field for Dynamic 3D Gaussian Splatting
- Title(参考訳): 動的3次元ガウススプレイティングのための連続時間連続変形場としての液状ニューラルネットワーク
- Authors: Mingzhao Li, Arghya Pal, Guan Yuan Tan,
- Abstract要約: Deformable 3D Gaussian Splatting (D-3DGS)は、フレーム時間tの位置エンコードされたガウスアンを通して3Dの標準セットを変形することにより、モノクロビデオから動的シーンを再構築する。
LNN(Liquid Neural Network)による閉鎖型連続時間セルのスタックとして変形場を最適化する。
結果は、離散変形場を t の明示的な連続時間関数に変換する、ほぼゼロフリクションのアーキテクチャ設計である。
- 参考スコア(独自算出の注目度): 4.1711003960475495
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deformable 3D Gaussian Splatting (D-3DGS) re-constructs dynamic scenes from monocular video by deforming a canonical set of 3D Gaussians through a positional-encoded MLP of frame time t. Although fitted to a continuous variable, the MLP couples no two values of t in its architecture and effectively predicts discrete per-frame offsets, leaving temporal smoothness to emerge only as a byproduct of optimisation. We redesign the deformation field as a stack of Closed-form Continuous-time (CfC) cells, a Liquid Neural Network (LNN), that is the closed-form solution of the Liquid Time-constant ODE while preserving every other part of the D-3DGS pipeline. Each cell exposes a sigmoidal time gate that interpolates between two candidate hidden states, baking a learned smooth response to t into the loss landscape without invoking any numerical solver. On the eight D-NeRF and seven NeRF-DS scenes the liquid field matches or exceeds the MLP baseline in aggregate, with its largest gains concentrated on the scenes with the most high-frequency articulated motion. The result is a near-zero-friction architectural design that turns the discrete MLP deformation field into an explicit continuous-time function of t.
- Abstract(参考訳): Deformable 3D Gaussian Splatting (D-3DGS)は、3D Gaussianの標準セットをフレーム時間tの位置符号化MLPで変形することにより、モノクロビデオから動的シーンを再構築する。
連続変数に適合するが、MLPはアーキテクチャにおいてtの2つの値を結合せず、離散的なフレーム単位のオフセットを効果的に予測し、時間的滑らかさは最適化の副産物としてのみ現れる。
我々は、変形場を、D-3DGSパイプラインの他の全ての部分を保存しながら、LNN(Liquid Neural Network)の閉形解である閉形連続時間(CfC)セルのスタックとして再設計する。
各セルは、2つの候補隠れ状態の間を補間するシグモダル時間ゲートを露出し、数値解法を呼び出すことなく、tに対する学習されたスムーズな応答を損失ランドスケープに焼き付ける。
8つのD-NeRFと7つのNeRF-DSのシーンでは、液体場は総じてMLPベースラインを超え、最も高頻度の調音運動でシーンに集中している。
その結果、離散 MLP 変形場を t の明示的な連続時間関数に変換する、ほぼゼロフリクションのアーキテクチャ設計となる。
関連論文リスト
- GS-STVSR: Ultra-Efficient Continuous Spatio-Temporal Video Super-Resolution via 2D Gaussian Splatting [71.12303582606019]
Continuous Video Super-Resolution (C-STVSR) は、任意のスケールファクタによる動画の空間的・フレーム的レートの同時向上を目的としている。
2次元ガウシアンティング(2D-GS)に基づく超効率的なC-STVSRフレームワークであるGS-STVSRを提案する。
GS-STVSRは,すべてのベンチマークにおいて最先端の品質を実現していることを示す。
論文 参考訳(メタデータ) (2026-04-20T10:11:05Z) - Forecasting as Rendering: A 2D Gaussian Splatting Framework for Time Series Forecasting [79.37674445572462]
時系列予測(TSF)は、周期内変動と周期間トレンドの複雑な絡み合いのため、依然として困難な問題である。
形状変化テンソルを静止画像として扱うと、トポロジカルミスマッチが発生する。
均一な固定サイズの表現に依存することは、モデリング能力を非効率に割り当てる。
TimeGSは、予測パラダイムをレグレッションから2D生成レンダリングに根本的にシフトする、新しいフレームワークである。
論文 参考訳(メタデータ) (2026-02-10T14:13:36Z) - FLAG-4D: Flow-Guided Local-Global Dual-Deformation Model for 4D Reconstruction [7.144085821875197]
FLAG-4Dは3Dガウス原始体が空間と時間を通してどのように進化するかを再構築する。
最先端の手法よりも細かな細部で高忠実で時間的に整合した再構築を実現する。
論文 参考訳(メタデータ) (2026-02-09T11:55:15Z) - Continuous Space-Time Video Super-Resolution with 3D Fourier Fields [62.270473766381976]
連続時空ビデオ超解像のための新しい定式化法を提案する。
モデリング関節は空間的および時間的超解像の両方を大幅に改善することを示す。
論文 参考訳(メタデータ) (2025-09-30T14:34:02Z) - ODE-GS: Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting [13.520967762833408]
3次元ガウススプラッティングと潜在ニューラル常微分方程式(ODE)を統合する新しいアプローチODE-GSを導入する。
提案手法はまず,観測ウィンドウ内で正確なガウス軌道を生成するモデルを学習し,その上でトランスフォーマーエンコーダを訓練して,過去の軌跡をニューラルODEを介して進化した潜時状態に集約する。
数値積分はスムーズで物理的に妥当な未来のガウス軌道を生成し、任意の未来のタイムスタンプでのレンダリングを可能にする。
論文 参考訳(メタデータ) (2025-06-05T18:02:30Z) - SHaDe: Compact and Consistent Dynamic 3D Reconstruction via Tri-Plane Deformation and Latent Diffusion [0.0]
本稿では3つの重要な要素を統合した動的3次元シーン再構成のための新しいフレームワークを提案する。
明示的な三面変形場、球面調和(SH)注目の視野条件付き正準場、時間的に認識される潜在拡散。
提案手法は,時間とともに進化する3つの2次元特徴面を用いて4次元シーンを符号化し,効率的なコンパクト表現を実現する。
論文 参考訳(メタデータ) (2025-05-22T11:25:38Z) - Point Cloud Denoising With Fine-Granularity Dynamic Graph Convolutional Networks [58.050130177241186]
ノイズの摂動は、しばしば3次元の点雲を破損させ、表面の再構成、レンダリング、さらなる処理といった下流のタスクを妨げる。
本稿では,GDGCNと呼ばれる粒度動的グラフ畳み込みネットワークについて紹介する。
論文 参考訳(メタデータ) (2024-11-21T14:19:32Z) - Dynamic Temporal Filtering in Video Models [128.02725199486719]
時間的特徴学習の新しいレシピである動的時間フィルタ(DTF)を提案する。
DTFは、その長距離時間ダイナミクスをモデル化するために、空間的位置ごとに特別な周波数フィルタを学習する。
DTFブロックをConvNetsとTransformerにプラグインすることで、DTF-NetとDTF-Transformerが得られる。
論文 参考訳(メタデータ) (2022-11-15T15:59:28Z) - Gait Recognition in the Wild with Multi-hop Temporal Switch [81.35245014397759]
野生での歩行認識は、より実践的な問題であり、マルチメディアとコンピュータビジョンのコミュニティの注目を集めています。
本稿では,現実のシーンにおける歩行パターンの効果的な時間的モデリングを実現するために,新しいマルチホップ時間スイッチ方式を提案する。
論文 参考訳(メタデータ) (2022-09-01T10:46:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。