論文の概要: Wild3R: Feed-Forward 3D Gaussian Splatting from Unconstrained Sparse Photo Collection
- arxiv url: http://arxiv.org/abs/2606.11894v2
- Date: Thu, 11 Jun 2026 05:01:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 13:39:59.67923
- Title: Wild3R: Feed-Forward 3D Gaussian Splatting from Unconstrained Sparse Photo Collection
- Title(参考訳): Wild3R: 制約なしスパース写真集からのフィードフォワード3Dガウス撮影
- Authors: Yuto Furutani, Takashi Otonari, Kaede Shiohara, Toshihiko Yamasaki,
- Abstract要約: 制約のないスパース写真収集のためのフィードフォワードアプローチWild3Rを提案する。
我々のモデルは、過渡的コンテンツを取り除きながら、参照ビューで条件付けられた視点間での外観整合性を学習する。
- 参考スコア(独自算出の注目度): 30.884035795245946
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Feed-forward 3D Gaussian Splatting (3DGS) removes the need for time-consuming per-scene optimization required by traditional 3DGS. However, existing feed-forward approaches struggle with real-world photo collections that include diverse lighting conditions and transient objects. In this paper, we present Wild3R, a feed-forward approach for unconstrained sparse photo collections. The main bottleneck is the lack of training data that provides multiple viewpoints, a variety of illuminations, and transient variations necessary for learning robust scene representations. To address this, we introduce the WildCity dataset, which comprises 200 scenes, 170 lighting conditions, and transient objects, resulting in 337,500 images in total. By leveraging the dataset, our model learns appearance consistency across viewpoints conditioned on reference views, while removing transient content. Extensive experiments demonstrate that our method outperforms existing feed-forward approaches and achieves results competitive with prior per-scene optimization-based methods.
- Abstract(参考訳): Feed-forward 3D Gaussian Splatting (3DGS)は、従来の3DGSで必要とされるシーンごとの時間的最適化の必要性を取り除く。
しかし、既存のフィードフォワードアプローチは、様々な照明条件や過渡的な物体を含む現実世界の写真収集に苦慮している。
本稿では、制約のないスパース写真収集のためのフィードフォワードアプローチWild3Rを提案する。
主なボトルネックは、複数の視点、様々なイルミネーション、堅牢なシーン表現を学ぶのに必要な過渡的なバリエーションを提供するトレーニングデータの欠如である。
これに対処するため、200のシーン、170の照明条件、一時的なオブジェクトからなるWildCityデータセットを導入し、合計で337,500の画像を生成する。
データセットを活用することで、我々のモデルは、過渡的コンテンツを取り除きながら、参照ビューで条件付けられた視点間の外観整合性を学習する。
大規模な実験により,本手法は既存のフィードフォワード手法よりも優れており,事前のシーンごとの最適化手法と競合する結果が得られることが示された。
関連論文リスト
- Generalizable Sparse-View 3D Reconstruction from Unconstrained Images [34.49488901858801]
GenWildSplatは、スパースビュー屋外再構築のためのフィードフォワードフレームワークである。
標準空間において、深さ、カメラパラメータ、および3Dガウスを予測します。
様々な照明と閉塞パターンを一般化する。
論文 参考訳(メタデータ) (2026-04-30T17:59:55Z) - WildSplatter: Feed-forward 3D Gaussian Splatting with Appearance Control from Unconstrained Images [8.46439977025813]
WildSplatterは、未知のカメラパラメータと様々な照明条件を持つ非拘束画像のためのフィードフォワード3Dガウススプラッティング(3DGS)モデルである。
入力画像に条件付き3Dガウスアンと外観埋め込みを共同で学習する。
提案手法は,3次元ガウシアンを1秒以内のスパース入力ビューから再構成し,多様な照明条件下での外観制御を可能にする。
論文 参考訳(メタデータ) (2026-04-23T00:58:43Z) - EVolSplat: Efficient Volume-based Gaussian Splatting for Urban View Synthesis [61.1662426227688]
既存のNeRFおよび3DGSベースの手法は、フォトリアリスティックレンダリングを実現する上で有望な結果を示すが、スローでシーンごとの最適化が必要である。
本稿では,都市景観を対象とした効率的な3次元ガウススプレイティングモデルEVolSplatを紹介する。
論文 参考訳(メタデータ) (2025-03-26T02:47:27Z) - GS-Blur: A 3D Scene-Based Dataset for Realistic Image Deblurring [50.72230109855628]
本稿では,新しい手法を用いて合成されたリアルなぼやけた画像のデータセットであるGS-Blurを提案する。
まず,3Dガウス・スプレイティング(3DGS)を用いて多視点画像から3Dシーンを再構成し,ランダムに生成された運動軌跡に沿ってカメラビューを移動させてぼやけた画像を描画する。
GS-Blurの再構築に様々なカメラトラジェクトリを採用することで、我々のデータセットは現実的で多様な種類のぼかしを含み、現実世界のぼかしをうまく一般化する大規模なデータセットを提供する。
論文 参考訳(メタデータ) (2024-10-31T06:17:16Z) - WildGaussians: 3D Gaussian Splatting in the Wild [80.5209105383932]
3DGSによる閉塞や外見の変化に対処する新しいアプローチであるWildGaussiansを紹介した。
我々はWildGaussianが3DGSとNeRFのベースラインを越えながら3DGSのリアルタイムレンダリング速度と一致していることを示す。
論文 参考訳(メタデータ) (2024-07-11T12:41:32Z) - MegaScenes: Scene-Level View Synthesis at Scale [69.21293001231993]
NVS (Scene-level novel view synthesis) は多くの視覚やグラフィックスの応用に基礎を置いている。
MegaScenesと呼ばれるインターネット写真コレクションから大規模なシーンレベルのデータセットを作成し、世界中の動き(SfM)から100K以上の構造を復元する。
我々は、最先端NVS手法の故障事例を分析し、生成一貫性を大幅に改善する。
論文 参考訳(メタデータ) (2024-06-17T17:55:55Z) - Wild-GS: Real-Time Novel View Synthesis from Unconstrained Photo Collections [30.321151430263946]
本稿では、制約のない写真コレクションに最適化された3DGSの革新的な適応であるWild-GSについて述べる。
Wild-GSは、それぞれの3Dガウスの出現を、その固有の材料特性、大域照明と画像当たりのカメラ特性、反射率の点レベルの局所的ばらつきによって決定する。
この斬新な設計は、参照ビューの高周波詳細外観を3次元空間に効果的に転送し、トレーニングプロセスを大幅に高速化する。
論文 参考訳(メタデータ) (2024-06-14T19:06:07Z) - SWAG: Splatting in the Wild images with Appearance-conditioned Gaussians [2.2369578015657954]
暗黙の神経表現法は、未構造化画像から3Dシーンを学習する際、顕著な進歩を見せている。
非教師的手法でシーンオブオーダの存在を対処するために、過渡的なガウシアンを訓練する新しいメカニズムを導入する。
論文 参考訳(メタデータ) (2024-03-15T16:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。