論文の概要: S3Net: 3D LiDAR Sparse Semantic Segmentation Network
- arxiv url: http://arxiv.org/abs/2103.08745v1
- Date: Mon, 15 Mar 2021 22:15:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-17 23:31:33.199627
- Title: S3Net: 3D LiDAR Sparse Semantic Segmentation Network
- Title(参考訳): S3Net: 3D LiDARスパースセマンティックセマンティックセグメンテーションネットワーク
- Authors: Ran Cheng, Ryan Razani, Yuan Ren and Liu Bingbing
- Abstract要約: S3NetはLiDARポイントクラウドセマンティックセグメンテーションのための新しい畳み込みニューラルネットワークである。
sparse intra-channel attention module (sintraam)とsparse inter-channel attention module (sinteram)で構成されるエンコーダ-デコーダバックボーンを採用する。
- 参考スコア(独自算出の注目度): 1.330528227599978
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic Segmentation is a crucial component in the perception systems of
many applications, such as robotics and autonomous driving that rely on
accurate environmental perception and understanding. In literature, several
approaches are introduced to attempt LiDAR semantic segmentation task, such as
projection-based (range-view or birds-eye-view), and voxel-based approaches.
However, they either abandon the valuable 3D topology and geometric relations
and suffer from information loss introduced in the projection process or are
inefficient. Therefore, there is a need for accurate models capable of
processing the 3D driving-scene point cloud in 3D space. In this paper, we
propose S3Net, a novel convolutional neural network for LiDAR point cloud
semantic segmentation. It adopts an encoder-decoder backbone that consists of
Sparse Intra-channel Attention Module (SIntraAM), and Sparse Inter-channel
Attention Module (SInterAM) to emphasize the fine details of both within each
feature map and among nearby feature maps. To extract the global contexts in
deeper layers, we introduce Sparse Residual Tower based upon sparse convolution
that suits varying sparsity of LiDAR point cloud. In addition, geo-aware
anisotrophic loss is leveraged to emphasize the semantic boundaries and
penalize the noise within each predicted regions, leading to a robust
prediction. Our experimental results show that the proposed method leads to a
large improvement (12\%) compared to its baseline counterpart (MinkNet42
\cite{choy20194d}) on SemanticKITTI \cite{DBLP:conf/iccv/BehleyGMQBSG19} test
set and achieves state-of-the-art mIoU accuracy of semantic segmentation
approaches.
- Abstract(参考訳): セマンティックセグメンテーションは、正確な環境認識と理解に依存するロボット工学や自律運転など、多くのアプリケーションの知覚システムにおいて重要な構成要素である。
文献では、プロジェクションベース(レンジビューまたは鳥眼ビュー)やボクセルベースアプローチなど、LiDARセマンティックセマンティックセマンティックセマンティクスタスクを試みるためにいくつかのアプローチが導入されている。
しかし、それらは貴重な3次元トポロジーと幾何学的関係を捨て、投影プロセスで導入された情報損失に苦しむか、あるいは非効率である。
したがって、3D空間で3次元駆動シーンの点雲を処理できる正確なモデルが必要である。
本稿では,LiDARポイントクラウドセマンティックセグメンテーションのための新しい畳み込みニューラルネットワークであるS3Netを提案する。
sparse intra-channel attention module(sintraam)とsparse inter-channel attention module(sinteram)で構成されるエンコーダ/デコーダバックボーンを採用し、各フィーチャーマップ内と近くのフィーチャーマップ間の詳細を強調する。
より深い層におけるグローバルなコンテキストを抽出するために,LiDAR点雲の幅の異なるスパース畳み込みに基づくスパース残差タワーを導入する。
さらに、ジオアウェアな異方性損失を利用して、意味的境界を強調し、各予測領域内のノイズを罰し、堅牢な予測を行う。
実験の結果,提案手法は,semantickitti \cite{dblp:conf/iccv/behleygmqbsg19}テストセットのベースライン(minknet42 \cite{choy20194d})と比較して大幅に改善し,意味セグメンテーションアプローチの最先端miou精度を実現した。
関連論文リスト
- Bayesian Self-Training for Semi-Supervised 3D Segmentation [59.544558398992386]
3Dセグメンテーションはコンピュータビジョンの中核的な問題である。
完全に教師されたトレーニングを採用するために、3Dポイントクラウドを密にラベル付けすることは、労働集約的で高価です。
半教師付きトレーニングは、ラベル付きデータの小さなセットのみを付与し、より大きなラベル付きデータセットを伴って、より実用的な代替手段を提供する。
論文 参考訳(メタデータ) (2024-09-12T14:54:31Z) - Large Generative Model Assisted 3D Semantic Communication [51.17527319441436]
本稿では,GAM-3DSC(Generative AI Model Assisted 3D SC)システムを提案する。
まず,ユーザ要求に基づいて3次元シナリオからキーセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティックなセマンティクスを抽出する。
次に、これらの多視点画像を符号化するための適応意味圧縮モデル(ASCM)を提案する。
最後に、物理チャネルのチャネル状態情報(CSI)を推定・精査するために、条件付き生成逆数ネットワークと拡散モデル支援チャネル推定(GDCE)を設計する。
論文 参考訳(メタデータ) (2024-03-09T03:33:07Z) - PointOcc: Cylindrical Tri-Perspective View for Point-based 3D Semantic
Occupancy Prediction [72.75478398447396]
本稿では,点雲を効果的かつ包括的に表現する円筒型三重対視図を提案する。
また,LiDAR点雲の距離分布を考慮し,円筒座標系における三点ビューを構築した。
プロジェクション中に構造の詳細を維持するために空間群プーリングを使用し、各TPV平面を効率的に処理するために2次元バックボーンを採用する。
論文 参考訳(メタデータ) (2023-08-31T17:57:17Z) - Push-the-Boundary: Boundary-aware Feature Propagation for Semantic
Segmentation of 3D Point Clouds [0.5249805590164901]
本研究では,オブジェクト境界近傍のセマンティックセグメンテーションを改善するための境界対応特徴伝搬機構を提案する。
1つの共有エンコーダで、ネットワークは、(i)境界ローカライゼーション、(ii)オブジェクトの内部を指す方向の予測、(iii)セマンティックセグメンテーションを3つの並列ストリームで出力する。
提案手法は境界誤差を低減することによって一貫した改善をもたらす。
論文 参考訳(メタデータ) (2022-12-23T15:42:01Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR-based
Perception [122.53774221136193]
運転時のLiDARに基づく認識のための最先端の手法は、しばしば点雲を2D空間に投影し、2D畳み込みによって処理する。
自然な対策として、3Dボクセル化と3D畳み込みネットワークを利用する方法がある。
本研究では,3次元幾何学的パターンを探索するために,円筒状分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-09-12T06:25:11Z) - S3CNet: A Sparse Semantic Scene Completion Network for LiDAR Point
Clouds [0.16799377888527683]
S3CNetはスパース畳み込みに基づくニューラルネットワークで、単一で統一されたLiDARポイントクラウドからセマンティックに完了したシーンを予測する。
提案手法は,Semantic KITTI ベンチマークを用いて,3次元課題における全ての課題に対して優れることを示す。
論文 参考訳(メタデータ) (2020-12-16T20:14:41Z) - Exploring Deep 3D Spatial Encodings for Large-Scale 3D Scene
Understanding [19.134536179555102]
生の3次元点雲の空間的特徴を非方向性グラフモデルに符号化することで,CNNに基づくアプローチの限界を克服する代替手法を提案する。
提案手法は、訓練時間とモデル安定性を改善して、最先端の精度で達成し、さらなる研究の可能性を示す。
論文 参考訳(メタデータ) (2020-11-29T12:56:19Z) - Cylindrical and Asymmetrical 3D Convolution Networks for LiDAR
Segmentation [81.02742110604161]
大規模運転シーンのLiDARセグメンテーションのための最先端の手法は、しばしば点雲を2次元空間に投影し、2D畳み込みによって処理する。
そこで我々は,3次元幾何学的パタンを探索するために,円筒分割と非対称な3次元畳み込みネットワークを設計する,屋外LiDARセグメンテーションのための新しいフレームワークを提案する。
提案手法はセマンティックKITTIのリーダーボードにおいて第1位を獲得し,既存のnuScenesの手法を約4%のマージンで上回っている。
論文 参考訳(メタデータ) (2020-11-19T18:53:11Z) - Improving Point Cloud Semantic Segmentation by Learning 3D Object
Detection [102.62963605429508]
ポイントクラウドセマンティックセグメンテーションは、自動運転において重要な役割を果たす。
現在の3Dセマンティックセグメンテーションネットワークは、よく表現されたクラスに対して優れた性能を発揮する畳み込みアーキテクチャに焦点を当てている。
Aware 3D Semantic Detection (DASS) フレームワークを提案する。
論文 参考訳(メタデータ) (2020-09-22T14:17:40Z) - TORNADO-Net: mulTiview tOtal vaRiatioN semAntic segmentation with
Diamond inceptiOn module [23.112192919085825]
TORNADO-Netは、3D LiDARポイントクラウドセマンティックセグメンテーションのためのニューラルネットワークである。
我々は、エンコーダデコーダResNetアーキテクチャを用いて、多視点(バードアイとレンジ)投影特徴抽出を組み込んだ。
また、LiDARデータは360度視野を包含し、円形のパディングを使用するという事実も活用する。
論文 参考訳(メタデータ) (2020-08-24T16:32:41Z) - Weakly Supervised Semantic Segmentation in 3D Graph-Structured Point
Clouds of Wild Scenes [36.07733308424772]
3Dセグメンテーションラベルの欠如は、効率的な点雲セグメンテーションの主な障害の1つである。
本稿では,2D のみを監督する点群における大規模セマンティックシーンセグメンテーションのための,新しいディープグラフ畳み込みネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-26T23:02:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。