論文の概要: City-scale Incremental Neural Mapping with Three-layer Sampling and
Panoptic Representation
- arxiv url: http://arxiv.org/abs/2209.14072v2
- Date: Wed, 12 Apr 2023 12:06:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 18:45:42.128425
- Title: City-scale Incremental Neural Mapping with Three-layer Sampling and
Panoptic Representation
- Title(参考訳): 3層サンプリングとパノプティカル表現を用いた都市規模インクリメンタルニューラルマッピング
- Authors: Yongliang Shi, Runyi Yang, Pengfei Li, Zirui Wu, Hao Zhao, Guyue Zhou
- Abstract要約: 我々は、環境レベルとインスタンスレベルのモデリングからなるパノプティクス表現を用いた都市規模連続型ニューラルマッピングシステムを構築した。
疎いLiDAR点雲のストリームが与えられると、3D座標を符号付き距離場(SDF)値にマッピングする動的生成モデルを維持する。
不完全な観測下でのインスタンスの高忠実度マッピングを実現するために、幾何学的詳細をより良くモデル化するために、カテゴリ固有の事前を導入している。
- 参考スコア(独自算出の注目度): 5.682979644056021
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural implicit representations are drawing a lot of attention from the
robotics community recently, as they are expressive, continuous and compact.
However, city-scale continual implicit dense mapping based on sparse LiDAR
input is still an under-explored challenge. To this end, we successfully build
a city-scale continual neural mapping system with a panoptic representation
that consists of environment-level and instance-level modelling. Given a stream
of sparse LiDAR point cloud, it maintains a dynamic generative model that maps
3D coordinates to signed distance field (SDF) values. To address the difficulty
of representing geometric information at different levels in city-scale space,
we propose a tailored three-layer sampling strategy to dynamically sample the
global, local and near-surface domains. Meanwhile, to realize high fidelity
mapping of instance under incomplete observation, category-specific prior is
introduced to better model the geometric details. We evaluate on the public
SemanticKITTI dataset and demonstrate the significance of the newly proposed
three-layer sampling strategy and panoptic representation, using both
quantitative and qualitative results. Codes and model will be publicly
available.
- Abstract(参考訳): ニューラルな暗黙の表現は、表現力があり、連続的でコンパクトであるため、最近ロボットコミュニティから多くの注目を集めている。
しかし、疎LiDAR入力に基づく都市規模連続暗黙マッピングは、まだ未探索の課題である。
この目的のために,パンオプティカル表現を環境レベルおよびインスタンスレベルモデルとした,都市規模の連続的ニューラルマッピングシステムの構築に成功した。
疎いLiDAR点雲のストリームが与えられると、3D座標を符号付き距離場(SDF)値にマッピングする動的生成モデルを維持する。
都市空間の異なるレベルにおける幾何学的情報を表現することの難しさに対処するために,グローバル,ローカル,および近地領域を動的にサンプリングする3層サンプリング戦略を提案する。
一方、不完全観測下でのインスタンスの忠実度マッピングを実現するために、幾何学的詳細をよりよくモデル化するためにカテゴリ固有事前を導入する。
本研究では,semantickittiデータセットの評価と,新たに提案する3層サンプリング戦略とパンオプティカル表現の意義を定量的および定性的に検証した。
コードとモデルは公開されます。
関連論文リスト
- Geometry Distributions [51.4061133324376]
本稿では,分布として幾何学をモデル化する新しい幾何学的データ表現を提案する。
提案手法では,新しいネットワークアーキテクチャを用いた拡散モデルを用いて表面点分布の学習を行う。
本研究では,多種多様な対象に対して質的かつ定量的に表現を評価し,その有効性を実証した。
論文 参考訳(メタデータ) (2024-11-25T04:06:48Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Outdoor Scene Extrapolation with Hierarchical Generative Cellular Automata [70.9375320609781]
我々は,自律走行車(AV)で多量に捕獲された大規模LiDARスキャンから微細な3次元形状を生成することを目指している。
本稿では,空間的にスケーラブルな3次元生成モデルである階層型生成セルオートマトン (hGCA) を提案する。
論文 参考訳(メタデータ) (2024-06-12T14:56:56Z) - Geometrically-driven Aggregation for Zero-shot 3D Point Cloud Understanding [11.416392706435415]
ゼロショット3Dポイントクラウド理解は2Dビジョンランゲージモデル(VLM)によって達成できる
既存の戦略は、ヴィジュアル・ランゲージ・モデル(Vision-Language Model)をレンダリングまたはキャプチャされた2Dピクセルから3Dポイントにマッピングし、固有かつ表現可能な雲の幾何学構造を見渡す。
本稿では, 点雲の3次元幾何学的構造を利用して, 移動したビジョン・ランゲージモデルの品質を向上させるための, 初となるトレーニングフリーアグリゲーション手法を提案する。
論文 参考訳(メタデータ) (2023-12-04T12:30:07Z) - LISNeRF Mapping: LiDAR-based Implicit Mapping via Semantic Neural Fields for Large-Scale 3D Scenes [2.822816116516042]
大規模セマンティックマッピングは、屋外の自律エージェントが計画やナビゲーションといった高度なタスクを遂行するために不可欠である。
本稿では,提案するLiDAR測度のみでの暗黙的表現による大規模3次元意味再構築手法を提案する。
論文 参考訳(メタデータ) (2023-11-04T03:55:38Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - Deep Implicit Surface Point Prediction Networks [49.286550880464866]
暗黙の関数としての3次元形状の深い神経表現は、高忠実度モデルを生成することが示されている。
本稿では,CSP(Nest Surface-point)表現と呼ばれる新しい種類の暗黙の表現を用いて,そのような曲面をモデル化する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2021-06-10T14:31:54Z) - Self-supervised Depth Estimation Leveraging Global Perception and
Geometric Smoothness Using On-board Videos [0.5276232626689566]
我々は,グローバルな特徴と局所的な特徴を同時に抽出する画素ワイド深度推定のためのDLNetを提案する。
幾何学的に自然な深度マップを予測するために3次元形状の滑らかさ損失を提案する。
KITTIとMake3Dベンチマークの実験では、提案したDLNetは最先端の手法と競合する性能を実現している。
論文 参考訳(メタデータ) (2021-06-07T10:53:27Z) - S3Net: 3D LiDAR Sparse Semantic Segmentation Network [1.330528227599978]
S3NetはLiDARポイントクラウドセマンティックセグメンテーションのための新しい畳み込みニューラルネットワークである。
sparse intra-channel attention module (sintraam)とsparse inter-channel attention module (sinteram)で構成されるエンコーダ-デコーダバックボーンを採用する。
論文 参考訳(メタデータ) (2021-03-15T22:15:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。