論文の概要: Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2506.05280v1
- Date: Thu, 05 Jun 2025 17:33:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-06 21:53:49.854866
- Title: Unifying Appearance Codes and Bilateral Grids for Driving Scene Gaussian Splatting
- Title(参考訳): 外観符号とバイラテラル格子を統一したガウス平滑運転法
- Authors: Nan Wang, Yuantao Chen, Lixing Xiao, Weiqing Xiao, Bohan Li, Zhaoxi Chen, Chongjie Ye, Shaocong Xu, Saining Zhang, Ziyang Yan, Pierre Merriaux, Lei Lei, Tianfan Xue, Hao Zhao,
- Abstract要約: 本稿では,外見符号と二元格子を統一する多スケール二元格子を提案する。
本手法は動的に分離された自律走行シーン再構築における幾何的精度を大幅に向上することを示す。
- 参考スコア(独自算出の注目度): 10.495368020038248
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural rendering techniques, including NeRF and Gaussian Splatting (GS), rely on photometric consistency to produce high-quality reconstructions. However, in real-world scenarios, it is challenging to guarantee perfect photometric consistency in acquired images. Appearance codes have been widely used to address this issue, but their modeling capability is limited, as a single code is applied to the entire image. Recently, the bilateral grid was introduced to perform pixel-wise color mapping, but it is difficult to optimize and constrain effectively. In this paper, we propose a novel multi-scale bilateral grid that unifies appearance codes and bilateral grids. We demonstrate that this approach significantly improves geometric accuracy in dynamic, decoupled autonomous driving scene reconstruction, outperforming both appearance codes and bilateral grids. This is crucial for autonomous driving, where accurate geometry is important for obstacle avoidance and control. Our method shows strong results across four datasets: Waymo, NuScenes, Argoverse, and PandaSet. We further demonstrate that the improvement in geometry is driven by the multi-scale bilateral grid, which effectively reduces floaters caused by photometric inconsistency.
- Abstract(参考訳): NeRF や Gaussian Splatting (GS) などのニューラルレンダリング技術は、高品質な再構成を実現するために光度整合性に依存している。
しかし、現実のシナリオでは、取得した画像の完全な光度整合性を保証することは困難である。
出現コードはこの問題に対処するために広く用いられてきたが、そのモデリング能力は制限されており、単一のコードが画像全体に適用される。
近年,ピクセルワイドカラーマッピングを行うために両側グリッドを導入したが,効果的に最適化・制約することは困難である。
本稿では,外見符号と二元格子を統一する多角的二元格子を提案する。
提案手法は,動的に分離された自律走行シーン再構成における幾何的精度を著しく向上し,外観符号と両側格子の両方に優れることを示した。
これは、障害物回避と制御のために正確な幾何学が重要である自律運転に不可欠である。
我々の手法はWaymo、NuScenes、Argoverse、PandaSetの4つのデータセットにまたがって強力な結果を示す。
さらに、幾何的改良は、多スケールの水平格子によって駆動され、光度不整合によるフローターを効果的に低減することを示した。
関連論文リスト
- Towards Lightweight Hyperspectral Image Super-Resolution with Depthwise Separable Dilated Convolutional Network [6.5149222591754725]
ハイパースペクトル画像超解像の課題に対処するために, 軽量な深度分離型拡張畳み込みネットワーク (DSDCN) を導入する。
平均二乗誤差(MSE)、L2ノルム正規化に基づく制約、スペクトル角に基づく損失を組み合わせたカスタム損失関数を提案する。
提案モデルは、2つの公開ハイパースペクトルデータセット上で非常に競争力のある性能を実現する。
論文 参考訳(メタデータ) (2025-05-01T07:57:23Z) - Robust GAN inversion [5.1359892878090845]
本稿では,ネイティブの潜伏空間を$W$で処理し,画像の詳細を復元するためにジェネレータネットワークをチューニングする手法を提案する。
Flickr-Faces-HQ と LSUN Church の2つの複雑なデータセットに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2023-08-31T07:47:11Z) - Towards Nonlinear-Motion-Aware and Occlusion-Robust Rolling Shutter
Correction [54.00007868515432]
既存の手法では、一様速度仮定による補正の精度を推定する上で、課題に直面している。
本稿では,個々の画素の高次補正場を正確に推定する,幾何的回転シャッター(QRS)運動解法を提案する。
提案手法は,Carla-RS,Fastec-RS,BS-RSCの各データセット上で,PSNRの+4.98,+0.77,+4.33を超える。
論文 参考訳(メタデータ) (2023-03-31T15:09:18Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - FastHuman: Reconstructing High-Quality Clothed Human in Minutes [18.643091757385626]
高品質な人体形状を数分で最適化する手法を提案する。
本手法はメッシュベースのパッチワープ手法を用いて,マルチビュー光度整合性を確保する。
提案手法は,合成データセットと実世界のデータセットの両方において有望な結果を示した。
論文 参考訳(メタデータ) (2022-11-26T05:16:39Z) - Degradation-agnostic Correspondence from Resolution-asymmetric Stereo [96.03964515969652]
テレワイドカメラシステムで取得した解像度の異なる2枚の画像からステレオマッチングの問題を考察する。
特徴量整合性という画像空間の代わりに特徴空間に2つのビュー間の整合性を課すことを提案する。
測光損失をトレーニングしたステレオマッチングネットワークは最適ではないが, 特徴抽出器は劣化に依存しない, マッチング特有の特徴を生成できる。
論文 参考訳(メタデータ) (2022-04-04T12:24:34Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - Leveraging Spatial and Photometric Context for Calibrated Non-Lambertian
Photometric Stereo [61.6260594326246]
空間と測光の両方を同時に活用できる効率的な完全畳み込みアーキテクチャを提案する。
分離可能な4D畳み込みと2D熱マップを使うことで、サイズが小さくなり、効率が向上する。
論文 参考訳(メタデータ) (2021-03-22T18:06:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。