論文の概要: 4D Panoptic Segmentation as Invariant and Equivariant Field Prediction
- arxiv url: http://arxiv.org/abs/2303.15651v1
- Date: Tue, 28 Mar 2023 00:20:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 16:58:59.531981
- Title: 4D Panoptic Segmentation as Invariant and Equivariant Field Prediction
- Title(参考訳): 不変および等変場予測としての4次元パノプティカルセグメンテーション
- Authors: Minghan Zhu, Shizong Han, Hong Cai, Shubhankar Borse, Maani Ghaffari
Jadidi, Fatih Porikli
- Abstract要約: 我々は4次元パノプティカルセグメンテーションのための回転同変ニューラルネットワークを開発した。
その結果,同種でないモデルに比べて計算コストが低いモデルの方が精度が高いことがわかった。
- 参考スコア(独自算出の注目度): 41.01641813346966
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we develop rotation-equivariant neural networks for 4D
panoptic segmentation. 4D panoptic segmentation is a recently established
benchmark task for autonomous driving, which requires recognizing semantic
classes and object instances on the road based on LiDAR scans, as well as
assigning temporally consistent IDs to instances across time. We observe that
the driving scenario is symmetric to rotations on the ground plane. Therefore,
rotation-equivariance could provide better generalization and more robust
feature learning. Specifically, we review the object instance clustering
strategies, and restate the centerness-based approach and the offset-based
approach as the prediction of invariant scalar fields and equivariant vector
fields. Other sub-tasks are also unified from this perspective, and different
invariant and equivariant layers are designed to facilitate their predictions.
Through evaluation on the standard 4D panoptic segmentation benchmark of
SemanticKITTI, we show that our equivariant models achieve higher accuracy with
lower computational costs compared to their non-equivariant counterparts.
Moreover, our method sets the new state-of-the-art performance and achieves 1st
place on the SemanticKITTI 4D Panoptic Segmentation leaderboard.
- Abstract(参考訳): 本稿では,4次元パノプティックセグメンテーションのための回転同変ニューラルネットワークを開発する。
4d panoptic segmentation(4d panoptic segmentation)は、lidarスキャンに基づいて道路上のセマンティッククラスとオブジェクトインスタンスを認識すると同時に、時間を越えたインスタンスに時間的一貫性のあるidを割り当てる、自動運転のための最近確立されたベンチマークタスクである。
運転シナリオは地上面上の回転と対称であることが観察された。
したがって、回転等価性はより良い一般化とより堅牢な特徴学習をもたらす。
具体的には,オブジェクトインスタンスのクラスタリング戦略を考察し,不変スカラー場と等価ベクトル場の予測として,中心性に基づくアプローチとオフセットに基づくアプローチを復元する。
他のサブタスクもこの観点からも統一されており、異なる不変および同変層はそれらの予測を容易にするように設計されている。
本研究では,Semantic KITTIの標準4Dパノプティクスセグメンテーションベンチマークを用いて,同変モデルが非等変モデルと比較して計算コストを低くして高い精度を達成することを示す。
さらに,本手法は,新しい最先端性能を設定し,SemanticKITTI 4D Panoptic Segmentation Leaderboardで1位を獲得している。
関連論文リスト
- Equivariant Spatio-Temporal Self-Supervision for LiDAR Object Detection [37.142470149311904]
本研究では,空間的および時間的拡張を両立させることにより,時間的同変学習の枠組みを提案する。
既存の等変および不変のアプローチを多くの設定で上回る3次元物体検出のための事前学習法を示す。
論文 参考訳(メタデータ) (2024-04-17T20:41:49Z) - Mask4Former: Mask Transformer for 4D Panoptic Segmentation [13.99703660936949]
Mask4Formerは、セマンティックインスタンスのセグメンテーションとトラッキングを統合する最初のトランスフォーマーベースのアプローチである。
本モデルは,手作りの非学習型アソシエーション戦略に頼ることなく,その時間的アソシエーションのセマンティックインスタンスを直接予測する。
Mask4Formerは68.4 LSTQのスコアでSemanticTITIテストセットの最先端を達成している。
論文 参考訳(メタデータ) (2023-09-28T03:30:50Z) - Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and
Motion Estimation [49.56131393810713]
本稿では、SE(3)同変アーキテクチャと、この課題に教師なしで取り組むためのトレーニング戦略を提案する。
本手法は,0.25Mパラメータと0.92G FLOPを用いて,モデル性能と計算効率を両立させる。
論文 参考訳(メタデータ) (2023-06-08T22:55:32Z) - Optimization Dynamics of Equivariant and Augmented Neural Networks [2.7918308693131135]
対称データに基づくニューラルネットワークの最適化について検討する。
アーキテクチャを制約する戦略を、データ拡張を使用する戦略と同等に扱う戦略と比較する。
後者の状況においても, 定常点が拡張トレーニングにおいて不安定であることは明らかだが, 明らかな同変モデルに対しては安定である。
論文 参考訳(メタデータ) (2023-03-23T17:26:12Z) - Self-Supervised Learning for Group Equivariant Neural Networks [75.62232699377877]
群同変ニューラルネットワーク(英: Group equivariant Neural Network)は、入力の変換で通勤する構造に制限されたモデルである。
自己教師型タスクには、同変プリテキストラベルと異変コントラスト損失という2つの概念を提案する。
標準画像認識ベンチマークの実験では、同変ニューラルネットワークが提案された自己教師型タスクを利用することを示した。
論文 参考訳(メタデータ) (2023-03-08T08:11:26Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Equivariant Point Network for 3D Point Cloud Analysis [17.689949017410836]
点雲解析のための実効的で実用的なSE(3)(3次元翻訳と回転)同変ネットワークを提案する。
まず,6次元の畳み込みを2つの分離可能な畳み込み作用素に分解する新しい枠組みであるSE(3)分離点畳み込みを提案する。
第2に,同変特徴の表現性を効果的に活用するアテンション層を導入する。
論文 参考訳(メタデータ) (2021-03-25T21:57:10Z) - Invariant Deep Compressible Covariance Pooling for Aerial Scene
Categorization [80.55951673479237]
本研究では,空気シーン分類におけるニュアンス変動を解決するために,新しい不変な深部圧縮性共分散プール (IDCCP) を提案する。
本研究では,公開空間画像データセットに関する広範な実験を行い,最先端の手法と比較して,この手法の優位性を実証する。
論文 参考訳(メタデータ) (2020-11-11T11:13:07Z) - Quaternion Equivariant Capsule Networks for 3D Point Clouds [58.566467950463306]
本稿では,3次元回転と翻訳に同値な点雲を処理するための3次元カプセルモジュールを提案する。
カプセル間の動的ルーティングをよく知られたWeiszfeldアルゴリズムに接続する。
オペレーターに基づいて、ポーズから幾何学をアンタングルするカプセルネットワークを構築します。
論文 参考訳(メタデータ) (2019-12-27T13:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。