Fugu-MT 論文翻訳(概要): CoherentGS: Sparse Novel View Synthesis with Coherent 3D Gaussians

論文の概要: CoherentGS: Sparse Novel View Synthesis with Coherent 3D Gaussians

arxiv url: http://arxiv.org/abs/2403.19495v1
Date: Thu, 28 Mar 2024 15:27:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-29 15:44:37.920985
Title: CoherentGS: Sparse Novel View Synthesis with Coherent 3D Gaussians
Title（参考訳）: CoherentGS: Coherent 3D Gaussianを用いた疎新なビュー合成
Authors: Avinash Paliwal, Wei Ye, Jinhui Xiong, Dmytro Kotovenko, Rakesh Ranjan, Vikas Chandra, Nima Khademi Kalantari,
Abstract要約: 2次元画像空間で制御できる構造付きガウス表現を導入する。次に、ガウス群、特にその位置を制約し、最適化中に独立に動くのを防ぐ。我々は,様々な場面における最先端のスパースビュー NeRF ベースのアプローチと比較して,顕著な改善を示した。
参考スコア（独自算出の注目度）: 18.42203035154126
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The field of 3D reconstruction from images has rapidly evolved in the past few years, first with the introduction of Neural Radiance Field (NeRF) and more recently with 3D Gaussian Splatting (3DGS). The latter provides a significant edge over NeRF in terms of the training and inference speed, as well as the reconstruction quality. Although 3DGS works well for dense input images, the unstructured point-cloud like representation quickly overfits to the more challenging setup of extremely sparse input images (e.g., 3 images), creating a representation that appears as a jumble of needles from novel views. To address this issue, we propose regularized optimization and depth-based initialization. Our key idea is to introduce a structured Gaussian representation that can be controlled in 2D image space. We then constraint the Gaussians, in particular their position, and prevent them from moving independently during optimization. Specifically, we introduce single and multiview constraints through an implicit convolutional decoder and a total variation loss, respectively. With the coherency introduced to the Gaussians, we further constrain the optimization through a flow-based loss function. To support our regularized optimization, we propose an approach to initialize the Gaussians using monocular depth estimates at each input view. We demonstrate significant improvements compared to the state-of-the-art sparse-view NeRF-based approaches on a variety of scenes.
Abstract（参考訳）: 画像からの3D再構成の分野は、まずNeural Radiance Field(NeRF)を導入し、最近では3D Gaussian Splatting(3DGS)を導入して、ここ数年で急速に発展してきた。後者は、トレーニングと推論の速度、および再構築品質において、NeRFに対して重要なエッジを提供する。 3DGSは、密度の高い入力画像に対してうまく機能するが、非構造化のポイントクラウドのような表現は、非常にスパースな入力画像(例:3画像)のより困難なセットアップに素早く適合し、新しいビューから針の集合として現れる表現を生成する。この問題に対処するため,正規化最適化と深度に基づく初期化を提案する。我々のキーとなる考え方は、2次元画像空間で制御できる構造付きガウス表現を導入することである。次に、ガウス群、特にその位置を制約し、最適化中に独立に動くのを防ぐ。具体的には、暗黙の畳み込みデコーダと全変動損失により、シングルビューとマルチビューの制約を導入する。ガウス人に導入されたコヒーレンシーにより、フローベース損失関数により最適化をさらに制約する。正規化された最適化を支援するために,各入力ビューにおける単分子深度推定を用いてガウスを初期化する手法を提案する。我々は,様々な場面における最先端のスパースビュー NeRF ベースのアプローチと比較して,顕著な改善を示した。

関連論文リスト

DropGaussian: Structural Regularization for Sparse-view Gaussian Splatting [5.216151302783165]
本稿では,DropGaussianと呼ばれる3次元ガウススプラッティングの簡易な変更による事前自由化手法を提案する。具体的には、トレーニングプロセス中にランダムにガウスをドロップアウトで除去し、非除外ガウスがより大きな勾配を持つようにします。このような単純な操作は、オーバーフィッティング問題を効果的に軽減し、新規なビュー合成の品質を高める。
論文参考訳（メタデータ） (2025-04-01T13:23:34Z)
GPS-Gaussian+: Generalizable Pixel-wise 3D Gaussian Splatting for Real-Time Human-Scene Rendering from Sparse Views [67.34073368933814]
スパースビューカメラ設定下での高解像度画像レンダリングのための一般化可能なガウススプラッティング手法を提案する。我々は,人間のみのデータや人景データに基づいてガウスパラメータ回帰モジュールをトレーニングし,深度推定モジュールと共同で2次元パラメータマップを3次元空間に引き上げる。いくつかのデータセットに対する実験により、我々の手法はレンダリング速度を超越しながら最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2024-11-18T08:18:44Z)
No Pose, No Problem: Surprisingly Simple 3D Gaussian Splats from Sparse Unposed Images [100.80376573969045]
NoPoSplatは、多視点画像から3Dガウスアンによってパラメータ化された3Dシーンを再構成できるフィードフォワードモデルである。提案手法は,推定時にリアルタイムな3次元ガウス再構成を実現する。この研究は、ポーズフリーの一般化可能な3次元再構成において大きな進歩をもたらし、実世界のシナリオに適用可能であることを示す。
論文参考訳（メタデータ） (2024-10-31T17:58:22Z)
Binocular-Guided 3D Gaussian Splatting with View Consistency for Sparse View Synthesis [53.702118455883095]
本稿では,ガウススプラッティングを用いたスパースビューから新しいビューを合成する新しい手法を提案する。私たちのキーとなるアイデアは、両眼画像間の両眼立体的一貫性に固有の自己超越を探索することにあります。我々の手法は最先端の手法よりも優れています。
論文参考訳（メタデータ） (2024-10-24T15:10:27Z)
UniGS: Modeling Unitary 3D Gaussians for Novel View Synthesis from Sparse-view Images [20.089890859122168]
我々は,新しい3次元ガウス再構成と新しいビュー合成モデルであるUniGSを紹介する。 UniGSは、任意の数のスパースビュー画像から3Dガウスの高忠実度表現を予測する。
論文参考訳（メタデータ） (2024-10-17T03:48:02Z)
MCGS: Multiview Consistency Enhancement for Sparse-View 3D Gaussian Radiance Fields [73.49548565633123]
3Dガウシアンによって表現される放射場は、高いトレーニング効率と高速レンダリングの両方を提供する、新しいビューの合成に優れている。既存の手法では、高密度推定ネットワークからの奥行き先を組み込むことが多いが、入力画像に固有の多視点一貫性を見落としている。本稿では,3次元ガウス・スプレイティング(MCGS)に基づくビュー・フレームワークを提案し,スパークス・インプット・ビューからシーンを再構築する。
論文参考訳（メタデータ） (2024-10-15T08:39:05Z)
MVGS: Multi-view-regulated Gaussian Splatting for Novel View Synthesis [22.80370814838661]
ボリュームレンダリングにおける最近の研究、例えばNeRFや3D Gaussian Splatting (3DGS)は、レンダリング品質と効率を大幅に向上させた。 4つの重要な貢献を具現化した新しい3DGS最適化手法を提案する。
論文参考訳（メタデータ） (2024-10-02T23:48:31Z)
AugGS: Self-augmented Gaussians with Structural Masks for Sparse-view 3D Reconstruction [9.953394373473621]
スパースビュー3D再構成はコンピュータビジョンにおける大きな課題である。本研究では,スパース・ビュー3D再構成のための構造マスクを付加した自己拡張型2段ガウス・スプレイティング・フレームワークを提案する。提案手法は,認識品質における最先端性能と,スパース入力との多視点整合性を実現する。
論文参考訳（メタデータ） (2024-08-09T03:09:22Z)
LoopSparseGS: Loop Based Sparse-View Friendly Gaussian Splatting [18.682864169561498]
LoopSparseGSは、疎結合なビュー合成タスクのためのループベースの3DGSフレームワークである。 Sparse-Friended Smpling (SFS) 戦略を導入し,ガウス楕円体を過剰に処理し,画素誤差が大きくなった。 4つのデータセットの実験により、LoopSparseGSはスパース・インプット・ノベルビューの合成において既存の最先端の手法よりも優れていることが示された。
論文参考訳（メタデータ） (2024-08-01T03:26:50Z)
GaussianRoom: Improving 3D Gaussian Splatting with SDF Guidance and Monocular Cues for Indoor Scene Reconstruction [3.043712258792239]
ニューラルネットワークSDFと3DGSを統合した統合フレームワークを提案する。このフレームワークには学習可能なニューラルネットワークSDFフィールドが組み込まれており、ガウスの密度化と刈り取りをガイドしている。本手法は, 表面再構成と新しいビュー合成の両面において, 最先端の性能を実現する。
論文参考訳（メタデータ） (2024-05-30T03:46:59Z)
InstantSplat: Sparse-view Gaussian Splatting in Seconds [91.77050739918037]
InstantSplatは,光速でスパークビュー3Dシーンを再現する新しい手法である。 InstantSplatでは,3Dシーン表現とカメラポーズを最適化する,自己管理フレームワークを採用している。 3D-GSの従来のSfMと比較して、30倍以上の再現を達成し、視覚的品質(SSIM)を0.3755から0.7624に改善する。
論文参考訳（メタデータ） (2024-03-29T17:29:58Z)
Sparse-view CT Reconstruction with 3D Gaussian Volumetric Representation [13.667470059238607]
Sparse-view CTは従来のCTスキャンの放射線線量を減らすための有望な戦略である。近年、3Dガウスアンは複雑な自然シーンのモデル化に応用されている。スパース・ビューCT再建の可能性について検討した。
論文参考訳（メタデータ） (2023-12-25T09:47:33Z)
GPS-Gaussian: Generalizable Pixel-wise 3D Gaussian Splatting for Real-time Human Novel View Synthesis [70.24111297192057]
我々は、文字の新たなビューをリアルタイムに合成するための新しいアプローチ、GPS-Gaussianを提案する。提案手法は,スパースビューカメラ設定下での2K解像度のレンダリングを可能にする。
論文参考訳（メタデータ） (2023-12-04T18:59:55Z)
FSGS: Real-Time Few-shot View Synthesis using Gaussian Splatting [58.41056963451056]
本稿では,3次元ガウススプラッティングに基づく数ショットビュー合成フレームワークを提案する。このフレームワークは3つのトレーニングビューでリアルタイムおよびフォトリアリスティックなビュー合成を可能にする。 FSGSは、さまざまなデータセットの精度とレンダリング効率の両方で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2023-12-01T09:30:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。