論文の概要: AziNorm: Exploiting the Radial Symmetry of Point Cloud for
Azimuth-Normalized 3D Perception
- arxiv url: http://arxiv.org/abs/2203.13090v1
- Date: Thu, 24 Mar 2022 14:29:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 14:32:36.008668
- Title: AziNorm: Exploiting the Radial Symmetry of Point Cloud for
Azimuth-Normalized 3D Perception
- Title(参考訳): azinorm: azimuth正規化3次元知覚における点雲の半径対称性の活用
- Authors: Shaoyu Chen, Xinggang Wang, Tianheng Cheng, Wenqiang Zhang, Qian
Zhang, Chang Huang and Wenyu Liu
- Abstract要約: アジマス正規化(AziNorm)は、半径方向に沿った点雲を正規化し、アジマスの差による変動を排除する。
AziNormは、ほとんどのLiDARベースの知覚方法に柔軟に組み込むことができる。
- 参考スコア(独自算出の注目度): 42.783040308336524
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Studying the inherent symmetry of data is of great importance in machine
learning. Point cloud, the most important data format for 3D environmental
perception, is naturally endowed with strong radial symmetry. In this work, we
exploit this radial symmetry via a divide-and-conquer strategy to boost 3D
perception performance and ease optimization. We propose Azimuth Normalization
(AziNorm), which normalizes the point clouds along the radial direction and
eliminates the variability brought by the difference of azimuth. AziNorm can be
flexibly incorporated into most LiDAR-based perception methods. To validate its
effectiveness and generalization ability, we apply AziNorm in both object
detection and semantic segmentation. For detection, we integrate AziNorm into
two representative detection methods, the one-stage SECOND detector and the
state-of-the-art two-stage PV-RCNN detector. Experiments on Waymo Open Dataset
demonstrate that AziNorm improves SECOND and PV-RCNN by 7.03 mAPH and 3.01 mAPH
respectively. For segmentation, we integrate AziNorm into KPConv. On
SemanticKitti dataset, AziNorm improves KPConv by 1.6/1.1 mIoU on val/test set.
Besides, AziNorm remarkably improves data efficiency and accelerates
convergence, reducing the requirement of data amounts or training epochs by an
order of magnitude. SECOND w/ AziNorm can significantly outperform fully
trained vanilla SECOND, even trained with only 10% data or 10% epochs. Code and
models are available at https://github.com/hustvl/AziNorm.
- Abstract(参考訳): データの固有対称性の研究は、機械学習において非常に重要である。
ポイントクラウドは3次元環境知覚において最も重要なデータフォーマットであり、強い放射対称性を持つ。
本研究では,この放射対称性を利用して3次元知覚性能を向上し,最適化を容易にする。
Azimuth Normalization (AziNorm) を提案する。これは、半径方向に沿った点雲を正規化し、方位差による変動を解消する。
AziNormは、ほとんどのLiDARベースの知覚方法に柔軟に組み込むことができる。
その有効性と一般化能力を検証するため、オブジェクト検出とセマンティックセグメンテーションの両方にAziNormを適用する。
検出には、AziNormを1段のSECOND検出器と最先端のPV-RCNN検出器の2つの代表的な検出方法に統合する。
Waymo Open Datasetの実験では、AziNormはSECONDとPV-RCNNをそれぞれ7.03mAPHと3.01mAPHで改善している。
セグメンテーションでは、AziNormをKPConvに統合します。
SemanticKittiデータセットでは、AziNormはval/testセットでKPConvを1.6/1 mIoU改善する。
さらに、AziNormはデータ効率を大幅に改善し、収束を加速し、データ量やエポックのトレーニングを桁違いに削減する。
SECOND w/AziNormは、10%のデータまたは10%のエポックでトレーニングされた、完全にトレーニングされたバニラSECONDを大幅に上回る。
コードとモデルはhttps://github.com/hustvl/AziNorm.comで入手できる。
関連論文リスト
- RSAR: Restricted State Angle Resolver and Rotated SAR Benchmark [61.987291551925516]
単位円制限損失を組み込んで角度予測精度を向上させるユニットサイクルリゾルバを導入する。
提案手法は,既存の最先端教師あり手法の性能を効果的に向上させることができる。
UCRの助けを借りて、これまでで最大の多クラス回転SARオブジェクト検出データセットであるRSARをさらに注釈し、導入する。
論文 参考訳(メタデータ) (2025-01-08T11:41:47Z) - Sense Less, Generate More: Pre-training LiDAR Perception with Masked Autoencoders for Ultra-Efficient 3D Sensing [0.6340101348986665]
本稿では,環境の広範囲なトレーニングに基づいて予測可能か,あるいは全体的な予測精度に限界がある環境の一部ではなく,環境の一部を生成する,破壊的かつフラグアルなLiDAR知覚データフローを提案する。
この目的のために提案した生成前訓練戦略であるR-MAE(Radially masked autoencoding)は、オンフィールド操作中にランダムに生成された角状領域のレーザパワーを選択的に活性化制御することにより、典型的なLiDARシステムでも容易に実装できる。
論文 参考訳(メタデータ) (2024-06-12T03:02:54Z) - Boosting 3D Object Detection by Simulating Multimodality on Point Clouds [51.87740119160152]
本稿では,LiDAR 画像検出器に追従する特徴や応答をシミュレートすることで,単一モダリティ (LiDAR) 3次元物体検出器を高速化する新しい手法を提案する。
このアプローチでは、単一モダリティ検出器をトレーニングする場合のみ、LiDARイメージデータを必要とし、十分にトレーニングされた場合には、推論時にのみLiDARデータが必要である。
nuScenesデータセットの実験結果から,本手法はSOTA LiDARのみの3D検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-06-30T01:44:30Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - SA-Det3D: Self-Attention Based Context-Aware 3D Object Detection [9.924083358178239]
本稿では,3次元物体検出におけるコンテキストモデリングのための2種類の自己注意法を提案する。
まず,現状のbev,voxel,ポイントベース検出器にペアワイズ自着機構を組み込む。
次に,ランダムにサンプリングされた位置の変形を学習することにより,最も代表的な特徴のサブセットをサンプリングするセルフアテンション変種を提案する。
論文 参考訳(メタデータ) (2021-01-07T18:30:32Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z) - A Smooth Representation of Belief over SO(3) for Deep Rotation Learning
with Uncertainty [33.627068152037815]
本稿では、3次元回転群の新しい対称行列表現 SO(3) と、学習モデルに特に適する2つの重要な性質について述べる。
我々は,2つのデータモダリティに基づいて深部神経回転回帰器を訓練することにより,定式化の利点を実証的に検証した。
この機能は、新しい入力を検出することで、学習したモデルの破滅的な失敗を防ぐ安全クリティカルなアプリケーションにとって鍵となる。
論文 参考訳(メタデータ) (2020-06-01T15:57:45Z) - Scan-based Semantic Segmentation of LiDAR Point Clouds: An Experimental
Study [2.6205925938720833]
最先端の手法では、深いニューラルネットワークを使用して、LiDARスキャンの各点のセマンティッククラスを予測する。
LiDAR測定を処理するための強力で効率的な方法は、2次元の画像のような投影を使うことである。
メモリの制約だけでなく、パフォーマンスの向上やランタイムの改善など、さまざまなテクニックを実証する。
論文 参考訳(メタデータ) (2020-04-06T11:08:12Z) - On the Arbitrary-Oriented Object Detection: Classification based
Approaches Revisited [94.5455251250471]
まず,既存の回帰型回転検出器が抱える境界問題は,角周期性や角秩序によって引き起こされることを示した。
我々は、角予測タスクを回帰問題から分類問題に変換する。
得られた円形分布角分類問題に対して、まず、角度の周期性に対処し、隣り合う角度に対する誤差耐性を高めるために、円スムースラベル法を考案する。
論文 参考訳(メタデータ) (2020-03-12T03:23:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。