Fugu-MT 論文翻訳(概要): TranSplat: Generalizable 3D Gaussian Splatting from Sparse Multi-View Images with Transformers

論文の概要: TranSplat: Generalizable 3D Gaussian Splatting from Sparse Multi-View Images with Transformers

arxiv url: http://arxiv.org/abs/2408.13770v1
Date: Sun, 25 Aug 2024 08:37:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-27 18:00:02.868262
Title: TranSplat: Generalizable 3D Gaussian Splatting from Sparse Multi-View Images with Transformers
Title（参考訳）: TranSplat: トランスフォーマーを用いたスパースマルチビュー画像からの一般化可能な3次元ガウススプレイティング
Authors: Chuanrui Zhang, Yingshuang Zou, Zhuoling Li, Minmin Yi, Haoqian Wang,
Abstract要約: 我々は,正確な局所特徴マッチングを導くために,予測深度信頼マップを利用する戦略を開発する。本稿では,RealEstate10KベンチマークとACIDベンチマークの両方で最高の性能を示すTranSplatという新しいG-3DGS手法を提案する。
参考スコア（独自算出の注目度）: 14.708092244093665
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Compared with previous 3D reconstruction methods like Nerf, recent Generalizable 3D Gaussian Splatting (G-3DGS) methods demonstrate impressive efficiency even in the sparse-view setting. However, the promising reconstruction performance of existing G-3DGS methods relies heavily on accurate multi-view feature matching, which is quite challenging. Especially for the scenes that have many non-overlapping areas between various views and contain numerous similar regions, the matching performance of existing methods is poor and the reconstruction precision is limited. To address this problem, we develop a strategy that utilizes a predicted depth confidence map to guide accurate local feature matching. In addition, we propose to utilize the knowledge of existing monocular depth estimation models as prior to boost the depth estimation precision in non-overlapping areas between views. Combining the proposed strategies, we present a novel G-3DGS method named TranSplat, which obtains the best performance on both the RealEstate10K and ACID benchmarks while maintaining competitive speed and presenting strong cross-dataset generalization ability. Our code, and demos will be available at: https://xingyoujun.github.io/transplat.
Abstract（参考訳）: Nerfのような従来の3次元再構成手法と比較して、最近のジェネラライズ可能な3次元ガウススティング(G-3DGS)法は、スパース・ビュー・セッティングにおいても印象的な効率性を示している。しかし,既存のG-3DGS手法の有望な再構成性能は,正確なマルチビュー特徴マッチングに大きく依存しており,非常に困難である。特に、様々なビューの間に重複しない領域が多く、類似した領域が多数存在するシーンでは、既存の手法との整合性が乏しく、復元精度が限られている。この問題に対処するため、予測深度信頼マップを用いて正確な局所特徴マッチングを導出する戦略を開発する。さらに,既存の単眼深度推定モデルの知識を,ビュー間の非重複領域における深度推定精度を高めるために利用することを提案する。提案手法を組み合わせた新しいG-3DGS手法であるTranSplatを提案する。これはRealEstate10KベンチマークとACベンチマークの両方において、競争速度を維持しつつ、強力なクロスデータセット一般化能力を示す。私たちのコードとデモは、https://xingyoujun.github.io/transplat.comで公開されます。

関連論文リスト

GS-RoadPatching: Inpainting Gaussians via 3D Searching and Placing for Driving Scenes [19.288891609639602]
GS-RoadPatching(GS-RoadPatching)は、完全に再構成された領域を参照してシーン完了を駆動する方法である。提案手法は,3DGSモダリティによる代替シーンの塗り絵や編集を可能にする。
論文参考訳（メタデータ） (2025-09-24T09:44:37Z)
FreeSplat++: Generalizable 3D Gaussian Splatting for Efficient Indoor Scene Reconstruction [50.534213038479926]
FreeSplat++は大規模な屋内全シーン再構築の代替手法である。深度調整による微調整により,再現精度が大幅に向上し,トレーニング時間も大幅に短縮された。
論文参考訳（メタデータ） (2025-03-29T06:22:08Z)
CrossView-GS: Cross-view Gaussian Splatting For Large-scale Scene Reconstruction [5.528874948395173]
マルチブランチ構築と融合に基づく大規模シーン再構築のための新しいクロスビューガウス分割法を提案する。本手法は,最先端の手法と比較して,新規なビュー合成における優れた性能を実現する。
論文参考訳（メタデータ） (2025-01-03T08:24:59Z)
CityGaussianV2: Efficient and Geometrically Accurate Reconstruction for Large-Scale Scenes [53.107474952492396]
CityGaussianV2は大規模なシーン再構築のための新しいアプローチである。分解段階の密度化・深さ回帰手法を実装し, ぼやけたアーチファクトを除去し, 収束を加速する。本手法は, 視覚的品質, 幾何学的精度, ストレージ, トレーニングコストの両立を図っている。
論文参考訳（メタデータ） (2024-11-01T17:59:31Z)
PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文参考訳（メタデータ） (2024-10-29T15:28:15Z)
GSplatLoc: Grounding Keypoint Descriptors into 3D Gaussian Splatting for Improved Visual Localization [1.4466437171584356]
3D Gaussian Splatting (3DGS) は、空間的特徴を持つ3次元幾何学とシーンの外観の両方をコンパクトに符号化することができる。モデルの空間的理解を改善するために,高密度キーポイント記述子を3DGSに蒸留することを提案する。提案手法はNeRFMatchやPNeRFLocなど,最先端のニューラル・レンダー・ポース(NRP)法を超越した手法である。
論文参考訳（メタデータ） (2024-09-24T23:18:32Z)
SpotlessSplats: Ignoring Distractors in 3D Gaussian Splatting [44.42317312908314]
3D Gaussian Splatting (3DGS)は、3D再構成のための有望な技術であり、効率的なトレーニングとレンダリング速度を提供する。現在の手法では、3DGSのビュー間の一貫性の仮定を満たすために、高度に制御された環境が必要である。 SpotLessSplatsは、トレーニング済みと汎用の機能と頑健な最適化を併用して、過渡的障害を効果的に無視するアプローチである。
論文参考訳（メタデータ） (2024-06-28T17:07:11Z)
LP-3DGS: Learning to Prune 3D Gaussian Splatting [71.97762528812187]
本稿では,トレーニング可能な2値マスクを重要度に応用し,最適プルーニング比を自動的に検出する3DGSを提案する。実験の結果,LP-3DGSは効率と高品質の両面において良好なバランスを保っていることがわかった。
論文参考訳（メタデータ） (2024-05-29T05:58:34Z)
SAGS: Structure-Aware 3D Gaussian Splatting [53.6730827668389]
本研究では,シーンの形状を暗黙的に符号化する構造認識型ガウス散乱法(SAGS)を提案する。 SAGSは、最先端のレンダリング性能と、ベンチマークノベルビュー合成データセットのストレージ要件の削減を反映している。
論文参考訳（メタデータ） (2024-04-29T23:26:30Z)
AbsGS: Recovering Fine Details for 3D Gaussian Splatting [10.458776364195796]
3D Gaussian Splatting (3D-GS) 技術は3Dプリミティブを相違可能なガウス化と組み合わせて高品質な新規ビュー結果を得る。しかし、3D-GSは、高頻度の詳細を含む複雑なシーンで過度に再構成の問題に悩まされ、ぼやけた描画画像に繋がる。本稿では,前述の人工物,すなわち勾配衝突の原因を包括的に分析する。我々の戦略は過度に再構成された地域のガウス人を効果的に同定し、分割して細部を復元する。
論文参考訳（メタデータ） (2024-04-16T11:44:12Z)
latentSplat: Autoencoding Variational Gaussians for Fast Generalizable 3D Reconstruction [48.86083272054711]
latentSplatは3D潜在空間における意味ガウスを予測し、軽量な生成型2Dアーキテクチャで切り落としてデコードする手法である。 latentSplatは、高速でスケーラブルで高解像度なデータでありながら、復元品質と一般化におけるこれまでの成果よりも優れていることを示す。
論文参考訳（メタデータ） (2024-03-24T20:48:36Z)
GaussianPro: 3D Gaussian Splatting with Progressive Propagation [49.918797726059545]
3DGSはStructure-from-Motion (SfM)技術によって生成されるポイントクラウドに大きく依存している。本稿では, 3次元ガウスの密度化を導くために, プログレッシブ・プログレッシブ・プログレッシブ・ストラテジーを適用した新しい手法を提案する。提案手法はデータセット上の3DGSを大幅に上回り,PSNRでは1.15dBの改善が見られた。
論文参考訳（メタデータ） (2024-02-22T16:00:20Z)
GS-SLAM: Dense Visual SLAM with 3D Gaussian Splatting [51.96353586773191]
我々は,まず3次元ガウス表現を利用したtextbfGS-SLAM を提案する。提案手法は,地図の最適化とRGB-Dレンダリングの大幅な高速化を実現するリアルタイム微分可能なスプレイティングレンダリングパイプラインを利用する。提案手法は,Replica,TUM-RGBDデータセット上の既存の最先端リアルタイム手法と比較して,競争性能が向上する。
論文参考訳（メタデータ） (2023-11-20T12:08:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。