論文の概要: Efficient Camera Pose Augmentation for View Generalization in Robotic Policy Learning
- arxiv url: http://arxiv.org/abs/2603.29192v1
- Date: Tue, 31 Mar 2026 02:56:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.066637
- Title: Efficient Camera Pose Augmentation for View Generalization in Robotic Policy Learning
- Title(参考訳): ロボット政策学習における視点一般化のための効率的なカメラポーズ向上
- Authors: Sen Wang, Huaiyi Dong, Jingyi Tian, Jiayi Li, Zhuo Yang, Tongtong Cao, Anlin Chen, Shuang Wu, Le Wang, Sanping Zhou,
- Abstract要約: GenSplatはフィードフォワード型3Dガウス型スプレイティングフレームワークで、ビュー一般化政策学習を容易にする。
これらの安定な3次元表現から多様な合成ビューを描画することにより、トレーニング中に観察多様体を体系的に増強する。
- 参考スコア(独自算出の注目度): 42.18646270150553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prevailing 2D-centric visuomotor policies exhibit a pronounced deficiency in novel view generalization, as their reliance on static observations hinders consistent action mapping across unseen views. In response, we introduce GenSplat, a feed-forward 3D Gaussian Splatting framework that facilitates view-generalized policy learning through novel view rendering. GenSplat employs a permutation-equivariant architecture to reconstruct high-fidelity 3D scenes from sparse, uncalibrated inputs in a single forward pass. To ensure structural integrity, we design a 3D-prior distillation strategy that regularizes the 3DGS optimization, preventing the geometric collapse typical of purely photometric supervision. By rendering diverse synthetic views from these stable 3D representations, we systematically augment the observational manifold during training. This augmentation forces the policy to ground its decisions in underlying 3D structures, thereby ensuring robust execution under severe spatial perturbations where baselines severely degrade.
- Abstract(参考訳): 一般的な2D中心のビジュモータポリシーは、静的な観察に依存しているため、目に見えない視点をまたいだ一貫した行動マッピングを妨げているため、新しい視点の一般化において顕著な不足を示す。
そこで我々は,新しいビューレンダリングによる視点一般化政策学習を支援するフィードフォワード3DガウススティングフレームワークであるGenSplatを紹介した。
GenSplatは変分同変アーキテクチャを用いて、1つのフォワードパスでスパースで未調整の入力から高忠実度3Dシーンを再構築する。
構造的整合性を確保するため、3DGS最適化を規則化し、純光度監視の典型的な幾何学的崩壊を防ぐ3D-優先蒸留方式を設計する。
これらの安定な3次元表現から多様な合成ビューを描画することにより、トレーニング中に観察多様体を体系的に増強する。
この強化により、政策は下層の3D構造に決定を下すことになり、基線がひどく劣化する厳しい空間摂動の下で堅牢な実行が保証される。
関連論文リスト
- OracleGS: Grounding Generative Priors for Sparse-View Gaussian Splatting [78.70702961852119]
OracleGSは、Gaussian Splattingのスパースビューのために、生成的完全性と回帰的忠実性を調整している。
提案手法は,多視点幾何学的証拠に先立って強力な生成条件を定め,幻覚的アーティファクトをフィルタリングし,非拘束領域における可塑性完備を保存している。
論文 参考訳(メタデータ) (2025-09-27T11:19:32Z) - PF3plat: Pose-Free Feed-Forward 3D Gaussian Splatting [54.7468067660037]
PF3platは、設計選択を検証した包括的なアブレーション研究によってサポートされた、すべてのベンチマークに新しい最先端を設定します。
本フレームワークは,3DGSの高速,スケーラビリティ,高品質な3D再構成とビュー合成機能を活用している。
論文 参考訳(メタデータ) (2024-10-29T15:28:15Z) - GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。