論文の概要: LeC$^2$O-NeRF: Learning Continuous and Compact Large-Scale Occupancy for Urban Scenes
- arxiv url: http://arxiv.org/abs/2411.11374v1
- Date: Mon, 18 Nov 2024 08:37:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:27:20.070143
- Title: LeC$^2$O-NeRF: Learning Continuous and Compact Large-Scale Occupancy for Urban Scenes
- Title(参考訳): LeC$^2$O-NeRF: 都市景観における連続的かつ大規模活動の学習
- Authors: Zhenxing Mi, Dan Xu,
- Abstract要約: NeRFにおいて重要な問題は、空き空間のスキップと点サンプリングを誘導するために、占有率を効果的に見積もることである。
本稿では, 3次元点を占有点または占有点に分類できる, 連続的かつコンパクトな大規模占有網を提案する。
実験では,我々の占有網は,占有網よりもコンパクトで,正確で,スムーズな占有網を迅速に学習することができる。
- 参考スコア(独自算出の注目度): 14.795422511173554
- License:
- Abstract: In NeRF, a critical problem is to effectively estimate the occupancy to guide empty-space skipping and point sampling. Grid-based methods work well for small-scale scenes. However, on large-scale scenes, they are limited by predefined bounding boxes, grid resolutions, and high memory usage for grid updates, and thus struggle to speed up training for large-scale, irregularly bounded and complex urban scenes without sacrificing accuracy. In this paper, we propose to learn a continuous and compact large-scale occupancy network, which can classify 3D points as occupied or unoccupied points. We train this occupancy network end-to-end together with the radiance field in a self-supervised manner by three designs. First, we propose a novel imbalanced occupancy loss to regularize the occupancy network. It makes the occupancy network effectively control the ratio of unoccupied and occupied points, motivated by the prior that most of 3D scene points are unoccupied. Second, we design an imbalanced architecture containing a large scene network and a small empty space network to separately encode occupied and unoccupied points classified by the occupancy network. This imbalanced structure can effectively model the imbalanced nature of occupied and unoccupied regions. Third, we design an explicit density loss to guide the occupancy network, making the density of unoccupied points smaller. As far as we know, we are the first to learn a continuous and compact occupancy of large-scale NeRF by a network. In our experiments, our occupancy network can quickly learn more compact, accurate and smooth occupancy compared to the occupancy grid. With our learned occupancy as guidance for empty space skipping on challenging large-scale benchmarks, our method consistently obtains higher accuracy compared to the occupancy grid, and our method can speed up state-of-the-art NeRF methods without sacrificing accuracy.
- Abstract(参考訳): NeRFにおいて重要な問題は、空き空間のスキップと点サンプリングを誘導するために、占有率を効果的に見積もることである。
グリッドベースの手法は小規模なシーンではうまく機能する。
しかし、大規模なシーンでは、事前に定義されたバウンディングボックス、グリッド解像度、グリッド更新のためのメモリ使用量によって制限されるため、大規模な、不規則にバウンドされた複雑な都市シーンのトレーニングを、精度を犠牲にすることなく高速化するのに苦労する。
本稿では, 3D 点を占有点または占有点と分類できる, 連続的かつコンパクトな大規模占有ネットワークを提案する。
我々は、この占有ネットワークを放射場と共に3つの設計で自己監督的に訓練する。
まず, 占有ネットワークを正規化するために, 新規な不均衡占有損失を提案する。
これにより、3Dシーンポイントの大半が占有されていないという先行の動機により、占有ネットワークは、占有されていないポイントと占有されているポイントの比率を効果的に制御できる。
第2に,大規模なシーンネットワークと小さな空き空間ネットワークを含む不均衡なアーキテクチャを設計し,占有されたポイントと占有されていないポイントを別々に符号化する。
この不均衡構造は、占有領域と非占有領域の不均衡の性質を効果的にモデル化することができる。
第三に、占有ネットワークを導くために明示的な密度損失を設計し、占有されていない点の密度を小さくする。
私たちが知る限り、我々はネットワークによって大規模なNeRFの連続的かつコンパクトな占有を学習した最初の人です。
実験では,我々の占有網は,占有網よりもコンパクトで,正確で,スムーズな占有網を迅速に学習することができる。
大規模ベンチマークに挑戦する空き空間スキッピングのガイダンスとして,本手法は占有格子よりも高い精度を得るとともに,精度を犠牲にすることなく最先端のNeRF法を高速化することができる。
関連論文リスト
- GLACE: Global Local Accelerated Coordinate Encoding [66.87005863868181]
シーン座標回帰法は小規模なシーンでは有効であるが、大規模シーンでは重大な課題に直面している。
本研究では,事前学習したグローバルおよびローカルのエンコーディングを統合したGLACEを提案する。
提案手法は,低マップサイズモデルを用いて,大規模シーンにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-06-06T17:59:50Z) - OccFlowNet: Towards Self-supervised Occupancy Estimation via
Differentiable Rendering and Occupancy Flow [0.6577148087211809]
本稿では,2次元ラベルのみを用いたニューラルレイディアンス場(NeRF)による占有率推定手法を提案する。
深度とセマンティックマップの予測や,2次元監視のみに基づく3次元ネットワークのトレーニングには,可変ボリュームレンダリングを用いる。
論文 参考訳(メタデータ) (2024-02-20T08:04:12Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - GridPull: Towards Scalability in Learning Implicit Representations from
3D Point Clouds [60.27217859189727]
大規模クラウドから暗黙の表現を学習する効率を改善するため,GridPullを提案する。
我々の斬新さは、ニューラルネットワークを使わずにグリッド上に定義された離散距離場の高速な推論にある。
我々は、一様格子を用いて高速グリッド探索を行い、サンプルクエリをローカライズし、木構造内の表面点を整理し、表面への距離の計算を高速化する。
論文 参考訳(メタデータ) (2023-08-25T04:52:52Z) - Scene as Occupancy [66.43673774733307]
OccNetは、カスケードと時間ボクセルデコーダを備えたビジョン中心のパイプラインで、3D占有を再構築する。
nuScenes上に構築された最初の高密度3D占有率ベンチマークであるOpenOccを提案する。
論文 参考訳(メタデータ) (2023-06-05T13:01:38Z) - Semi-signed neural fitting for surface reconstruction from unoriented
point clouds [53.379712818791894]
より優れた符号付き距離場を再構成するためのSN-Fittingを提案する。
SSNフィッティングは半署名の監督と損失に基づく領域サンプリング戦略で構成されている。
我々は,SSN-Fittingが,異なる設定下で最先端の性能を達成することを示す実験を行う。
論文 参考訳(メタデータ) (2022-06-14T09:40:17Z) - PDFNet: Pointwise Dense Flow Network for Urban-Scene Segmentation [0.0]
我々はポイントワイド高密度フローネットワーク(PDFNet)という新しい軽量アーキテクチャを提案する。
PDFNetでは、ネットワークのすべての部分へのスムーズな勾配流を可能にするために、密集、残留、複数ショートカット接続を使用します。
提案手法は,小規模なクラスや少数のデータレギュレーションにおいて,ベースラインを著しく上回る。
論文 参考訳(メタデータ) (2021-09-21T10:39:46Z) - Semi-supervised Network Embedding with Differentiable Deep Quantisation [81.49184987430333]
我々はネットワーク埋め込みのための微分可能な量子化法であるd-SNEQを開発した。
d-SNEQは、学習された量子化符号にリッチな高次情報を与えるためにランク損失を組み込む。
トレーニング済みの埋め込みのサイズを大幅に圧縮できるため、ストレージのフットプリントが減少し、検索速度が向上する。
論文 参考訳(メタデータ) (2021-08-20T11:53:05Z) - S3CNet: A Sparse Semantic Scene Completion Network for LiDAR Point
Clouds [0.16799377888527683]
S3CNetはスパース畳み込みに基づくニューラルネットワークで、単一で統一されたLiDARポイントクラウドからセマンティックに完了したシーンを予測する。
提案手法は,Semantic KITTI ベンチマークを用いて,3次元課題における全ての課題に対して優れることを示す。
論文 参考訳(メタデータ) (2020-12-16T20:14:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。