論文の概要: Ocean4D: Generative Underwater 4D Reconstruction via Medium-Aware Video Diffusion
- arxiv url: http://arxiv.org/abs/2606.23298v1
- Date: Mon, 22 Jun 2026 13:10:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:43:40.93161
- Title: Ocean4D: Generative Underwater 4D Reconstruction via Medium-Aware Video Diffusion
- Title(参考訳): Ocean4D:中規模ビデオ拡散による水中4D合成
- Authors: Yuqiang Huang, Yuxi Wang, Junyu Dong, Zhaoxiang Zhang,
- Abstract要約: そこで我々は,Ocean4Dという水中4D再構成のための生成フレームワークを提案する。
4D-GCCは、クロスフレームカバレッジを改善した4Dの幾何的整合条件を構築する。
中知ブロックは、潜水拡散過程において暗黙の中知デノイングを行い、水中の外観を安定させる。
- 参考スコア(独自算出の注目度): 53.39217286144327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater 4D reconstruction remains challenging due to the coupling between degraded light transport in participating media and dynamic water variations. Most existing Methods are developed under in-air assumptions and do not explicitly account for underwater absorption and backscatter. Additionally, near-static assumptions make these approaches sensitive to drifting particles and dynamic distractors , leading to unstable geometry and inconsistent cross-view results. To address these issues, we propose a generative framework for underwater 4D reconstruction, named Ocean4D, which is built on two complementary components. Specifically, 4D-GCC constructs 4D geometrically consistent conditioning with improved cross-frame coverage, while the Medium-Aware Block performs implicit medium-aware denoising in the latent diffusion process to stabilize underwater appearance under absorption and scattering. Given a monocular video and target cameras, our method generates videos along the target trajectories while preserving global structure and cross-view consistency. Extensive experiments on both dynamic and static underwater benchmarks demonstrate state-of-the-art performance on underwater reconstruction.
- Abstract(参考訳): 媒体中の劣化光輸送と動的水変量との結合により, 水中4Dの再構成は依然として困難である。
既存の方法の多くは空気中の仮定に基づいて開発されており、水中の吸収や後方散乱を明示的に考慮していない。
さらに、ほぼ静的な仮定は、これらのアプローチを漂流粒子やダイナミックな散逸器に敏感にし、不安定な幾何学と矛盾しないクロスビューの結果をもたらす。
これらの課題に対処するために,2つの相補的なコンポーネント上に構築されたOcean4Dという水中4D再構成のための生成フレームワークを提案する。
具体的には、4D-GCCは4次元の幾何的一貫した条件付けをクロスフレームカバレッジの改善とともに構成し、Medium-Aware Blockは潜伏拡散過程において暗黙の中間認識を行い、吸収・散乱下での水中の外観を安定化させる。
モノクロ映像とターゲットカメラが与えられた場合,本手法は,グローバルな構造と視界の整合性を保ちながら,対象軌跡に沿って映像を生成する。
動的および静的な水中ベンチマークの広範な実験は、水中の再構築における最先端の性能を示している。
関連論文リスト
- 4D-GSW: Kinematic-Aware Spatio-Temporal Consistent Watermarking for 4D Gaussian Splatting [25.65814375691728]
我々は,ロバストな著作権情報を埋め込むように設計されたキネマティックな透かしフレームワークである textbf4D-GSW を提案する。
従来の4Dステガノグラフィーとは違い,本手法では摂動運動軌跡の物理的コヒーレンスに対処する。
論文 参考訳(メタデータ) (2026-05-21T11:27:11Z) - 4DVGGT-D: 4D Visual Geometry Transformer with Improved Dynamic Depth Estimation [38.64669047442234]
そこで本研究では,静的から大まかに動的に切り離す学習自由なプログレッシブデカップリングフレームワークを提案する。
本手法は, 微調整を必要とせず, 頑健な4次元シーン再構成における競争性能を示す。
論文 参考訳(メタデータ) (2026-05-12T12:13:36Z) - Catalyst4D: High-Fidelity 3D-to-4D Scene Editing via Dynamic Propagation [51.4527986348543]
高品質な3D編集を動的4Dガウスシーンに転送するフレームワークであるCatalyst4Dを紹介する。
AMGは、オリジナルのガウスアンと編集されたガウスアンの両方から、構造的に安定で空間的に代表的なアンカーのセットを構築している。
CUARは、ガウス色当たりの不確かさを推定することにより、時間的外観整合性を維持する。
論文 参考訳(メタデータ) (2026-03-13T08:10:27Z) - OceanSplat: Object-aware Gaussian Splatting with Trinocular View Consistency for Underwater Scene Reconstruction [4.325717217536016]
OceanSplatは、水中のシーンで3D幾何学を表現するための新しい3Dガウススプレイティングベースのアプローチである。
そこで,OceanSplatは,散乱媒体におけるシーン復元と復元の両方において,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2026-01-08T14:38:39Z) - 3D-UIR: 3D Gaussian for Underwater 3D Scene Reconstruction via Physics Based Appearance-Medium Decoupling [30.985414238960466]
3D Gaussian Splatting (3DGS)はリアルタイムレンダリング機能を提供するが、水中の不均一な環境に苦しむ。
水媒体効果から物体の外観を遠ざける物理ベースの枠組みを提案する。
提案手法は,高品質な新規ビュー合成と物理的に正確なシーン復元を実現する。
論文 参考訳(メタデータ) (2025-05-27T14:19:30Z) - Enhancing Underwater Imaging with 4-D Light Fields: Dataset and Method [77.80712860663886]
4次元光場(LF)は、光吸収、散乱、その他の課題に悩まされる水中イメージングを強化する。
水中4次元LF画像強調と深度推定のためのプログレッシブフレームワークを提案する。
学習手法の定量的評価と教師あり訓練のための,最初の4次元LFに基づく水中画像データセットを構築した。
論文 参考訳(メタデータ) (2024-08-30T15:06:45Z) - EG4D: Explicit Generation of 4D Object without Score Distillation [105.63506584772331]
DG4Dは、スコア蒸留なしで高品質で一貫した4Dアセットを生成する新しいフレームワークである。
私たちのフレームワークは、世代品質のベースラインをかなりのマージンで上回ります。
論文 参考訳(メタデータ) (2024-05-28T12:47:22Z) - Diffusion4D: Fast Spatial-temporal Consistent 4D Generation via Video Diffusion Models [116.31344506738816]
高速でスケーラブルな4Dコンテンツ生成のための新しいフレームワーク textbfDiffusion4D を提案する。
ダイナミックな3Dアセットの軌道ビューを合成できる4D対応ビデオ拡散モデルを開発した。
提案手法は, 生成効率と4次元幾何整合性の観点から, 従来の最先端技術を超えている。
論文 参考訳(メタデータ) (2024-05-26T17:47:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。