論文の概要: GauSS-MI: Gaussian Splatting Shannon Mutual Information for Active 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2504.21067v1
- Date: Tue, 29 Apr 2025 13:47:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 23:53:02.736009
- Title: GauSS-MI: Gaussian Splatting Shannon Mutual Information for Active 3D Reconstruction
- Title(参考訳): GauSS-MI : アクティブ3次元再構成のためのガウススティングシャノン相互情報
- Authors: Yuhan Xie, Yixi Cai, Yinqiang Zhang, Lei Yang, Jia Pan,
- Abstract要約: 本研究は,リアルタイムなアクティブビュー選択と,アクティブな3次元再構成のための視覚的品質に関する不確実性定量化の課題に取り組む。
ニューラルレイディアンスフィールド(NeRF)や3Dガウススプラッティング(3DGS)などの最近の進歩は、再構成モデルの画像レンダリング品質を著しく向上させてきた。
- 参考スコア(独自算出の注目度): 18.528424809910884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This research tackles the challenge of real-time active view selection and uncertainty quantification on visual quality for active 3D reconstruction. Visual quality is a critical aspect of 3D reconstruction. Recent advancements such as Neural Radiance Fields (NeRF) and 3D Gaussian Splatting (3DGS) have notably enhanced the image rendering quality of reconstruction models. Nonetheless, the efficient and effective acquisition of input images for reconstruction-specifically, the selection of the most informative viewpoint-remains an open challenge, which is crucial for active reconstruction. Existing studies have primarily focused on evaluating geometric completeness and exploring unobserved or unknown regions, without direct evaluation of the visual uncertainty within the reconstruction model. To address this gap, this paper introduces a probabilistic model that quantifies visual uncertainty for each Gaussian. Leveraging Shannon Mutual Information, we formulate a criterion, Gaussian Splatting Shannon Mutual Information (GauSS-MI), for real-time assessment of visual mutual information from novel viewpoints, facilitating the selection of next best view. GauSS-MI is implemented within an active reconstruction system integrated with a view and motion planner. Extensive experiments across various simulated and real-world scenes showcase the superior visual quality and reconstruction efficiency performance of the proposed system.
- Abstract(参考訳): 本研究は,リアルタイムなアクティブビュー選択と,アクティブな3次元再構成のための視覚的品質に関する不確実性定量化の課題に取り組む。
視覚的品質は3D再構成の重要な側面である。
ニューラルレイディアンスフィールド(NeRF)や3Dガウススプラッティング(3DGS)などの最近の進歩は、再構成モデルの画像レンダリング品質を著しく向上させてきた。
それにもかかわらず、特に再構成のための効率的な効果的な入力画像の取得は、最も情報に富んだ視点の選定がオープンな課題であり、これはアクティブな再構築に不可欠である。
既存の研究は主に、再構成モデル内の視覚的不確実性を直接評価することなく、幾何学的完全性を評価し、観測されていない領域や未知領域を探索することに焦点を当ててきた。
このギャップに対処するために,各ガウスの視覚的不確実性を定量化する確率モデルを提案する。
シャノン・ミューチュアル・インフォメーション(Gaussian Splatting Shannon Mutual Information, GauSS-MI)は,シャノン・ミューチュアル・インフォメーション(Shannon Mutual Information, シャノン・ミューチュアル・インフォメーション, シャノン・ミューチュアル・インフォメーション, シャノン・ミューチュアル・インフォメーション, シャノン・ミューチュアル・インフォメーション, シャノン・インフォメーション, シャノン・ミューチュアル・インフォメーション, シャノン・インフォメーション, シャノン・インフォメーション, シャノン・インフォメーション・インフォメーション, シャノン・インフォメーション, シャノン・インフォメーション, シャノン・インフォメーション,
GauSS-MIはビュー・アンド・モーション・プランナーと統合されたアクティブ・リコンストラクション・システム内で実装されている。
シミュレーションおよび実世界の様々な場面における大規模な実験により,提案システムの性能向上と再現性の向上が示された。
関連論文リスト
- PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - Frequency-based View Selection in Gaussian Splatting Reconstruction [9.603843571051744]
入力画像の少ない3次元ガウススプラッティング再構成を行うためのアクティブビュー選択の問題について検討する。
周波数領域の潜在的なビューをランク付けすることで、新しい視点の潜在的な情報ゲインを効果的に推定することができる。
提案手法は,画像による3次元再構成を効果的に行う可能性を示し,ビュー選択の最先端性を実現する。
論文 参考訳(メタデータ) (2024-09-24T21:44:26Z) - GaussianStego: A Generalizable Stenography Pipeline for Generative 3D Gaussians Splatting [38.33958617286536]
GaussianStegoは、生成された3Dアセットのレンダリングにステガノグラフ情報を埋め込む方法である。
提案手法では,隠れた情報の正確な抽出を可能にする最適化フレームワークを採用している。
論文 参考訳(メタデータ) (2024-07-01T13:57:44Z) - MVSBoost: An Efficient Point Cloud-based 3D Reconstruction [4.282795945742752]
拡張現実や仮想現実、医用画像、映画特殊効果など、様々な応用において、効率的で正確な3D再構成が不可欠である。
従来のMulti-View Stereo (MVS) システムはこれらのアプリケーションには基本的だが、暗黙の3次元シーンモデリングは複雑なトポロジや連続面を扱う新しい可能性をもたらした。
論文 参考訳(メタデータ) (2024-06-19T13:02:17Z) - Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation [66.3814684757376]
本研究は,RGB 6Dのカテゴリレベルでのポーズ推定を向上するための拡散モデルに基づく新規ビュー合成器の実用性を示す最初の研究であるZero123-6Dを示す。
本手法は,データ要求の低減,ゼロショットカテゴリレベルの6Dポーズ推定タスクにおける深度情報の必要性の除去,およびCO3Dデータセットの実験により定量的に示された性能の向上を示す。
論文 参考訳(メタデータ) (2024-03-21T10:38:18Z) - Uncertainty Guided Policy for Active Robotic 3D Reconstruction using
Neural Radiance Fields [82.21033337949757]
本稿では,物体の暗黙のニューラル表現の各光線に沿ったカラーサンプルの重量分布のエントロピーを計算した線量不確実性推定器を提案する。
提案した推定器を用いた新しい視点から, 基礎となる3次元形状の不確かさを推測することが可能であることを示す。
ニューラルラディアンス場に基づく表現における線量不確実性によって導かれる次ベクター選択ポリシーを提案する。
論文 参考訳(メタデータ) (2022-09-17T21:28:57Z) - NeurAR: Neural Uncertainty for Autonomous 3D Reconstruction [64.36535692191343]
暗黙の神経表現はオフラインの3D再構成において魅力的な結果を示しており、オンラインSLAMシステムの可能性も最近示している。
本論文は,1)新しい表現に基づく視点計画の質を評価するための基準を求めること,2)手作りではなく,異なる場面に一般化可能なデータから基準を学習すること,の2つの課題に対処する。
本手法は, TSDFを用いた変形モデルやビュープランニングなしでの再構成モデルと比較した場合, レンダリングされた画像品質と再構成された3次元モデルの幾何学的品質について, 様々な指標について有意な改善を示す。
論文 参考訳(メタデータ) (2022-07-22T10:05:36Z) - MonoSDF: Exploring Monocular Geometric Cues for Neural Implicit Surface
Reconstruction [72.05649682685197]
最先端のニューラル暗黙法は、多くの入力ビューから単純なシーンの高品質な再構築を可能にする。
これは主に、十分な制約を提供していないRGB再構築損失の固有の曖昧さによって引き起こされる。
近年の単分子形状予測の分野での進歩に触発され, ニューラルな暗黙的表面再構成の改善にこれらの方法が役立つかを探究する。
論文 参考訳(メタデータ) (2022-06-01T17:58:15Z) - Neural 3D Reconstruction in the Wild [86.6264706256377]
そこで我々は,インターネット写真コレクションから効率よく高精度な表面再構成を実現する新しい手法を提案する。
そこで本研究では,これらのシーンにおける再構成性能を評価するための新しいベンチマークとプロトコルを提案する。
論文 参考訳(メタデータ) (2022-05-25T17:59:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。