論文の概要: SalsaNext: Fast, Uncertainty-aware Semantic Segmentation of LiDAR Point Clouds for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2003.03653v4
- Date: Wed, 20 Nov 2024 20:47:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-22 15:16:46.698005
- Title: SalsaNext: Fast, Uncertainty-aware Semantic Segmentation of LiDAR Point Clouds for Autonomous Driving
- Title(参考訳): SalsaNext: 自動運転のためのLiDAR点雲の高速かつ不確実性を考慮したセマンティックセマンティックセグメンテーション
- Authors: Tiago Cortinhal, George Tzelepis, Eren Erdal Aksoy,
- Abstract要約: 完全3次元LiDAR点雲の非確実性を考慮したセマンティックセマンティックセグメンテーションをリアルタイムに行うために,SalsaNextを紹介した。
SalsaNextはエンコーダ-デコーダアーキテクチャを持つSalsaNetの次期バージョンである。
- 参考スコア(独自算出の注目度): 0.6437284704257459
- License:
- Abstract: In this paper, we introduce SalsaNext for the uncertainty-aware semantic segmentation of a full 3D LiDAR point cloud in real-time. SalsaNext is the next version of SalsaNet [1] which has an encoder-decoder architecture where the encoder unit has a set of ResNet blocks and the decoder part combines upsampled features from the residual blocks. In contrast to SalsaNet, we introduce a new context module, replace the ResNet encoder blocks with a new residual dilated convolution stack with gradually increasing receptive fields and add the pixel-shuffle layer in the decoder. Additionally, we switch from stride convolution to average pooling and also apply central dropout treatment. To directly optimize the Jaccard index, we further combine the weighted cross-entropy loss with Lovasz-Softmax loss [2]. We finally inject a Bayesian treatment to compute the epistemic and aleatoric uncertainties for each point in the cloud. We provide a thorough quantitative evaluation on the Semantic-KITTI dataset [3], which demonstrates that the proposed SalsaNext outperforms other state-of-the-art semantic segmentation networks and ranks first on the Semantic-KITTI leaderboard. We also release our source code https://github.com/TiagoCortinhal/SalsaNext.
- Abstract(参考訳): 本稿では,完全3次元LiDAR点雲の非確実性を考慮したセマンティックセマンティックセマンティックセマンティクスをリアルタイムに実現するSalsaNextについて紹介する。
SalsaNextは、Encoder-decoderアーキテクチャを持つSalsaNet [1]の次期バージョンで、エンコーダユニットはResNetブロックのセットを持ち、デコーダ部は残余ブロックからアップサンプリングされた特徴を組み合わせる。
SalsaNetとは対照的に、新しいコンテキストモジュールを導入し、ResNetエンコーダブロックを新しい残差拡張畳み込みスタックに置き換える。
さらに, ストライド・コンボリューションから平均プーリングに切り替え, 中央ドロップアウト処理を適用した。
Jaccard指数を直接最適化するために、重み付きクロスエントロピー損失とLovasz-Softmax損失 [2] を更に組み合わせる。
最終的にベイズ処理を注入し、雲中の各点に対するてんかんおよびアレラトリックな不確実性を計算する。
本稿では,Semantic-KITTIデータセット[3]について詳細な定量的評価を行い,提案したSalsaNextが他の最先端セマンティックセマンティックセマンティックネットワークより優れており,Semantic-KITTIリーダーボードにランクインしていることを示す。
ソースコード https://github.com/TiagoCortinhal/SalsaNext もリリースしています。
関連論文リスト
- SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - SoftPool++: An Encoder-Decoder Network for Point Cloud Completion [93.54286830844134]
本稿では,ポイントクラウド完了作業のための新しい畳み込み演算子を提案する。
提案した演算子は、最大プールやボキセル化操作を一切必要としない。
提案手法は,低解像度・高解像度の形状仕上げにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2022-05-08T15:31:36Z) - Deep Point Cloud Reconstruction [74.694733918351]
3Dスキャンから得られる点雲は、しばしばスパース、ノイズ、不規則である。
これらの問題に対処するため、最近の研究は別々に行われ、不正確な点雲を密度化、復調し、完全な不正確な点雲を観測している。
本研究では,1) 初期密度化とデノナイズのための3次元スパース集積時間ガラスネットワーク,2) 離散ボクセルを3Dポイントに変換するトランスフォーマーによる改良,の2段階からなる深部点雲再構成ネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T07:53:28Z) - Dynamic Neural Representational Decoders for High-Resolution Semantic
Segmentation [98.05643473345474]
動的ニューラル表現デコーダ(NRD)と呼ばれる新しいデコーダを提案する。
エンコーダの出力上の各位置がセマンティックラベルの局所的なパッチに対応するので、この研究では、これらの局所的なパッチをコンパクトなニューラルネットワークで表現する。
このニューラル表現により、意味ラベル空間に先行する滑らかさを活用することができ、デコーダをより効率的にすることができる。
論文 参考訳(メタデータ) (2021-07-30T04:50:56Z) - Neural Network Modeling of Probabilities for Coding the Octree
Representation of Point Clouds [0.0]
本稿では,ボクセルの占有状況に対する符号化確率をニューラルネットワークを用いて推定する,新しいポイントクラウド圧縮アルゴリズムについて述べる。
提案したアルゴリズムは、ベンチマークデータセット上で最先端の結果を得る。
論文 参考訳(メタデータ) (2021-06-11T16:07:46Z) - HyperSeg: Patch-wise Hypernetwork for Real-time Semantic Segmentation [95.47168925127089]
本稿では,エンコーダがデコーダのパラメータ(重み)をエンコードして生成する,新しいリアルタイムセマンティックセグメンテーションネットワークを提案する。
我々は、より高レベルなコンテキスト特徴を描画するためのネストされたU-Netからなる新しいタイプのハイパーネットワークを設計する。
論文 参考訳(メタデータ) (2020-12-21T18:58:18Z) - Refinement of Predicted Missing Parts Enhance Point Cloud Completion [62.997667081978825]
点雲完了は、部分的な観測から3次元形状の点集合表現を用いて完全な幾何学を予測するタスクである。
従来のアプローチでは、不完全点集合によって供給されるエンコーダ・デコーダモデルにより、点雲全体を直接推定するニューラルネットワークが提案されていた。
本稿では、欠落した幾何を計算し、既知の入力と予測点クラウドを融合することに焦点を当てたエンドツーエンドニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-08T22:01:23Z) - TORNADO-Net: mulTiview tOtal vaRiatioN semAntic segmentation with
Diamond inceptiOn module [23.112192919085825]
TORNADO-Netは、3D LiDARポイントクラウドセマンティックセグメンテーションのためのニューラルネットワークである。
我々は、エンコーダデコーダResNetアーキテクチャを用いて、多視点(バードアイとレンジ)投影特徴抽出を組み込んだ。
また、LiDARデータは360度視野を包含し、円形のパディングを使用するという事実も活用する。
論文 参考訳(メタデータ) (2020-08-24T16:32:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。