Fugu-MT 論文翻訳(概要): Implicit Gaussian Splatting with Efficient Multi-Level Tri-Plane Representation

論文の概要: Implicit Gaussian Splatting with Efficient Multi-Level Tri-Plane Representation

arxiv url: http://arxiv.org/abs/2408.10041v2
Date: Sat, 09 Nov 2024 09:33:54 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:34.771731
Title: Implicit Gaussian Splatting with Efficient Multi-Level Tri-Plane Representation
Title（参考訳）: 効率的なマルチレベルトリプレーン表現による暗黙的ガウススプラッティング
Authors: Minye Wu, Tinne Tuytelaars,
Abstract要約: Implicit Gaussian Splatting (IGS)は、明示的なポイントクラウドと暗黙的な機能埋め込みを統合する革新的なハイブリッドモデルである。本稿では,空間正規化を具体化したレベルベースプログレッシブトレーニング手法を提案する。我々のアルゴリズムは、数MBしか使用せず、ストレージ効率とレンダリング忠実さを効果的にバランスして、高品質なレンダリングを実現することができる。
参考スコア（独自算出の注目度）: 45.582869951581785
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Recent advancements in photo-realistic novel view synthesis have been significantly driven by Gaussian Splatting (3DGS). Nevertheless, the explicit nature of 3DGS data entails considerable storage requirements, highlighting a pressing need for more efficient data representations. To address this, we present Implicit Gaussian Splatting (IGS), an innovative hybrid model that integrates explicit point clouds with implicit feature embeddings through a multi-level tri-plane architecture. This architecture features 2D feature grids at various resolutions across different levels, facilitating continuous spatial domain representation and enhancing spatial correlations among Gaussian primitives. Building upon this foundation, we introduce a level-based progressive training scheme, which incorporates explicit spatial regularization. This method capitalizes on spatial correlations to enhance both the rendering quality and the compactness of the IGS representation. Furthermore, we propose a novel compression pipeline tailored for both point clouds and 2D feature grids, considering the entropy variations across different levels. Extensive experimental evaluations demonstrate that our algorithm can deliver high-quality rendering using only a few MBs, effectively balancing storage efficiency and rendering fidelity, and yielding results that are competitive with the state-of-the-art.
Abstract（参考訳）: フォトリアリスティックな新規ビュー合成の最近の進歩はガウススプラッティング(3DGS)によって著しく推進されている。それでも、3DGSデータの明示的な性質にはかなりのストレージ要件が伴い、より効率的なデータ表現の必要性が強調されている。これを解決するために,多層三面体アーキテクチャによる暗黙的特徴埋め込みと明示的な点雲を統合する革新的なハイブリッドモデルであるImplicit Gaussian Splatting (IGS)を提案する。このアーキテクチャは、様々なレベルで異なる解像度の2次元特徴格子を特徴とし、連続的な空間領域表現を容易にし、ガウス原始体間の空間相関を強化する。この基盤を基盤として,空間正規化を明示するレベルベースプログレッシブ・トレーニング・スキームを導入する。本手法は,IGS表現のレンダリング品質とコンパクトさを両立させるため,空間的相関に重きを置いている。さらに,異なるレベルのエントロピー変動を考慮して,点雲と2次元特徴格子の両方に適した新しい圧縮パイプラインを提案する。大規模実験により,本アルゴリズムは,数MBで高画質なレンダリングを実現し,ストレージ効率とレンダリング精度を効果的にバランスさせ,最先端技術と競合する結果を得られることを示した。

関連論文リスト

H3R: Hybrid Multi-view Correspondence for Generalizable 3D Reconstruction [39.22287224290769]
H3Rは、潜在融合と注目に基づく機能集約を統合するハイブリッドフレームワークである。両パラダイムを統合することで,既存手法よりも2$times$高速に収束しながら,一般化が促進される。本手法は,ロバストなクロスデータセットの一般化を実証しながら,可変数および高分解能な入力ビューをサポートする。
論文参考訳（メタデータ） (2025-08-05T05:56:30Z)
FHGS: Feature-Homogenized Gaussian Splatting [7.238124816235862]
$textitFHGS$は物理モデルにインスパイアされた新しい3D機能融合フレームワークである。 3DGSのリアルタイムレンダリング効率を保ちながら、事前訓練されたモデルから3Dシーンへの任意の2D特徴の高精度マッピングを実現することができる。
論文参考訳（メタデータ） (2025-05-25T14:08:49Z)
Diffusion-Guided Gaussian Splatting for Large-Scale Unconstrained 3D Reconstruction and Novel View Synthesis [22.767866875051013]
本稿では,現行手法の限界に対処する多視点拡散モデルを用いて,新しい3DGSフレームワークであるGS-Diffを提案する。マルチビュー入力に条件付き擬似観測を生成することにより、制約の少ない3次元再構成問題をよく表されたものに変換する。 4つのベンチマークの実験では、GS-Diffは最先端のベースラインをかなりのマージンで一貫して上回っている。
論文参考訳（メタデータ） (2025-04-02T17:59:46Z)
GP-GS: Gaussian Processes for Enhanced Gaussian Splatting [10.45038376276218]
本稿では,スパースSfM点雲の適応的および不確実性誘導密度化を実現する新しい3次元再構成フレームワークを提案する。このパイプラインは不確実性推定を利用して、高分散予測のプルーニングを導く。合成および実世界のデータセットで行った実験は、提案フレームワークの有効性と実用性を検証する。
論文参考訳（メタデータ） (2025-02-04T12:50:16Z)
TSGaussian: Semantic and Depth-Guided Target-Specific Gaussian Splatting from Sparse Views [18.050257821756148]
TSGaussianは、新しいビュー合成タスクにおける幾何学的劣化を避けるために、意味的制約と深さ事前の制約を組み合わせる新しいフレームワークである。提案手法は,バックグラウンドアロケーションを最小化しながら,指定された目標に対する計算資源の優先順位付けを行う。大規模な実験により、TSGaussianは3つの標準データセット上で最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2024-12-13T11:26:38Z)
G2SDF: Surface Reconstruction from Explicit Gaussians with Implicit SDFs [84.07233691641193]
G2SDFはニューラル暗黙の符号付き距離場をガウススプラッティングフレームワークに統合する新しいアプローチである。 G2SDFは, 3DGSの効率を維持しつつ, 従来よりも優れた品質を実現する。
論文参考訳（メタデータ） (2024-11-25T20:07:07Z)
Geometric Algebra Planes: Convex Implicit Neural Volumes [70.12234371845445]
GA-Planes はスパース低ランク係数と低分解能行列と等価であることを示す。また,GA-Planeは既存の表現にも適用可能であることを示す。
論文参考訳（メタデータ） (2024-11-20T18:21:58Z)
DeSiRe-GS: 4D Street Gaussians for Static-Dynamic Decomposition and Surface Reconstruction for Urban Driving Scenes [71.61083731844282]
本稿では,自己教師型ガウススプラッティング表現であるDeSiRe-GSについて述べる。複雑な駆動シナリオにおいて、効率的な静的・動的分解と高忠実な表面再構成を可能にする。
論文参考訳（メタデータ） (2024-11-18T05:49:16Z)
PEP-GS: Perceptually-Enhanced Precise Structured 3D Gaussians for View-Adaptive Rendering [3.285531771049763]
ビューアダプティブレンダリングのための構造化3次元ガウスの最近の進歩は、ニューラルシーン表現において有望な結果を示している。 PEP-GSは3つの重要な革新を通じて構造化された3次元ガウシアンを強化する新しいフレームワークである。複数のデータセットにわたる包括的な評価は、現在の最先端の手法と比較して、これらの改善が特に困難なシナリオで顕著であることを示している。
論文参考訳（メタデータ） (2024-11-08T17:42:02Z)
PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文参考訳（メタデータ） (2024-10-29T15:28:15Z)
SuperGS: Super-Resolution 3D Gaussian Splatting via Latent Feature Field and Gradient-guided Splitting [3.5757604402398697]
SuperResolution 3DGS (SuperGS) は、2段階の粗大なトレーニングフレームワークで設計された3DGSの拡張である。 SuperGSは、低解像度入力のみを使用して現実世界のデータセットに挑戦する最先端のHRNVSメソッドを超越している。
論文参考訳（メタデータ） (2024-10-03T15:18:28Z)
GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization [1.4466437171584356]
軽量なXFeat特徴抽出器から高密度かつ堅牢なキーポイント記述器を3DGSに統合する2段階の手順を提案する。第2段階では、レンダリングベースの光度ワープ損失を最小限に抑え、初期ポーズ推定を洗練させる。広く使われている屋内および屋外データセットのベンチマークは、最近のニューラルレンダリングベースのローカライゼーション手法よりも改善されていることを示している。
論文参考訳（メタデータ） (2024-09-24T23:18:32Z)
Graph and Skipped Transformer: Exploiting Spatial and Temporal Modeling Capacities for Efficient 3D Human Pose Estimation [36.93661496405653]
我々は、簡潔なグラフとSkipped Transformerアーキテクチャを用いて、Transformer-temporal情報を活用するためのグローバルなアプローチを採っている。具体的には、3Dポーズの段階では、粗粒の体部が展開され、完全なデータ駆動適応モデルが構築される。実験はHuman3.6M、MPI-INF-3DHP、Human-Evaベンチマークで行われた。
論文参考訳（メタデータ） (2024-07-03T10:42:09Z)
S^2Former-OR: Single-Stage Bi-Modal Transformer for Scene Graph Generation in OR [50.435592120607815]
外科手術のシーングラフ生成(SGG)は、手術室(OR)におけるホモロジー認知知能の増強に不可欠であるこれまでの研究は主に多段階学習に依存しており、生成したセマンティックシーングラフはポーズ推定とオブジェクト検出を伴う中間プロセスに依存している。本研究では,S2Former-OR(S2Former-OR)と呼ばれるORにおけるSGGのための新しいシングルステージバイモーダルトランスフォーマフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-22T11:40:49Z)
Learning transformer-based heterogeneously salient graph representation for multimodal remote sensing image classification [42.15709954199397]
本稿では,変圧器を用いたヘテロジニアサリエントグラフ表現法(THSGR)を提案する。まず、多モード不均一グラフエンコーダを用いて、非ユークリッド構造の特徴を異種データから符号化する。自己アテンションフリーなマルチ畳み込み変調器は、効果的かつ効率的な長期依存性モデリングのために設計されている。
論文参考訳（メタデータ） (2023-11-17T04:06:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。