論文の概要: GP-S3Net: Graph-based Panoptic Sparse Semantic Segmentation Network
- arxiv url: http://arxiv.org/abs/2108.08401v1
- Date: Wed, 18 Aug 2021 21:49:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-21 04:00:12.197552
- Title: GP-S3Net: Graph-based Panoptic Sparse Semantic Segmentation Network
- Title(参考訳): gp-s3net:グラフベースのpanoptic sparse semantic segmentation network
- Authors: Ryan Razani, Ran Cheng, Enxu Li, Ehsan Taghavi, Yuan Ren, and Liu
Bingbing
- Abstract要約: GP-S3Netは提案なしのアプローチであり、オブジェクトを識別するためにオブジェクトの提案は必要ない。
私たちの新しいデザインは、セマンティックな結果を処理する新しいインスタンスレベルのネットワークで構成されています。
GP-S3Netは現在の最先端のアプローチよりも優れていた。
- 参考スコア(独自算出の注目度): 1.9949920338542213
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Panoptic segmentation as an integrated task of both static environmental
understanding and dynamic object identification, has recently begun to receive
broad research interest. In this paper, we propose a new computationally
efficient LiDAR based panoptic segmentation framework, called GP-S3Net.
GP-S3Net is a proposal-free approach in which no object proposals are needed to
identify the objects in contrast to conventional two-stage panoptic systems,
where a detection network is incorporated for capturing instance information.
Our new design consists of a novel instance-level network to process the
semantic results by constructing a graph convolutional network to identify
objects (foreground), which later on are fused with the background classes.
Through the fine-grained clusters of the foreground objects from the semantic
segmentation backbone, over-segmentation priors are generated and subsequently
processed by 3D sparse convolution to embed each cluster. Each cluster is
treated as a node in the graph and its corresponding embedding is used as its
node feature. Then a GCNN predicts whether edges exist between each cluster
pair. We utilize the instance label to generate ground truth edge labels for
each constructed graph in order to supervise the learning. Extensive
experiments demonstrate that GP-S3Net outperforms the current state-of-the-art
approaches, by a significant margin across available datasets such as, nuScenes
and SemanticPOSS, ranking first on the competitive public SemanticKITTI
leaderboard upon publication.
- Abstract(参考訳): 静的環境理解と動的物体識別の両方の統合タスクとしてのpanopticセグメンテーションは、最近幅広い研究の関心を集め始めている。
本稿では,GP-S3Netと呼ばれる,計算効率のよいLiDARベースのパノプティックセグメンテーションフレームワークを提案する。
GP-S3Netは、従来の2段パノラマシステムとは対照的に、オブジェクトを識別するためのオブジェクト提案は不要であり、インスタンス情報をキャプチャするために検出ネットワークが組み込まれている。
我々の新しいデザインは、オブジェクト(地上)を識別するグラフ畳み込みネットワークを構築することで、セマンティックな結果を処理する新しいインスタンスレベルネットワークで構成されています。
セマンティックセグメンテーションバックボーンからのフォアグラウンドオブジェクトのきめ細かいクラスタを通じて、オーバーセグメンテーション前処理が生成され、3Dスパース畳み込みによって処理され、各クラスタを埋め込む。
各クラスタはグラフ内のノードとして扱われ、その埋め込みはそのノードの特徴として使用される。
次にGCNNは、各クラスタペア間にエッジが存在するかどうかを予測する。
学習を監督するために,各構築したグラフに対して,サンプルラベルを用いて真理エッジラベルを生成する。
GP-S3Netは現在の最先端のアプローチよりも優れており、nuScenesやSemanticPOSSといった利用可能なデータセット間で大きな差がある。
関連論文リスト
- Deep Semantic Graph Matching for Large-scale Outdoor Point Clouds
Registration [22.308070598885532]
我々は、ポイントクラウド登録問題をセマンティックインスタンスマッチングと登録タスクとして扱う。
大規模屋外クラウド登録のためのディープセマンティックグラフマッチング法(DeepSGM)を提案する。
KITTIオドメトリデータセットで行った実験結果から,提案手法が登録性能を向上させることが示された。
論文 参考訳(メタデータ) (2023-08-10T03:07:28Z) - Local Structure-aware Graph Contrastive Representation Learning [12.554113138406688]
複数のビューからノードの構造情報をモデル化するための局所構造対応グラフ比較表現学習法(LS-GCL)を提案する。
ローカルビューでは、各ターゲットノードのセマンティックサブグラフが共有GNNエンコーダに入力され、サブグラフレベルに埋め込まれたターゲットノードを取得する。
グローバルな視点では、元のグラフはノードの必要不可欠な意味情報を保存しているので、共有GNNエンコーダを利用して、グローバルなグラフレベルでターゲットノードの埋め込みを学習する。
論文 参考訳(メタデータ) (2023-08-07T03:23:46Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - A Variational Edge Partition Model for Supervised Graph Representation
Learning [51.30365677476971]
本稿では,重なり合うノード群間の相互作用を集約することで,観測されたエッジがどのように生成されるかをモデル化するグラフ生成プロセスを提案する。
それぞれのエッジを複数のコミュニティ固有の重み付きエッジの和に分割し、コミュニティ固有のGNNを定義する。
エッジを異なるコミュニティに分割するGNNベースの推論ネットワーク,これらのコミュニティ固有のGNN,およびコミュニティ固有のGNNを最終分類タスクに組み合わせたGNNベースの予測器を共同で学習するために,変分推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-07T14:37:50Z) - CPSeg: Cluster-free Panoptic Segmentation of 3D LiDAR Point Clouds [2.891413712995641]
CPSegと呼ばれるLiDAR点雲のための新しいリアルタイム・エンド・エンド・エンド・パノプティクス・セグメンテーション・ネットワークを提案する。
CPSegは、共有エンコーダ、デュアルデコーダ、タスク認識アテンションモジュール(TAM)、クラスタフリーインスタンスセグメンテーションヘッドを備える。
論文 参考訳(メタデータ) (2021-11-02T16:44:06Z) - PIG-Net: Inception based Deep Learning Architecture for 3D Point Cloud
Segmentation [0.9137554315375922]
そこで我々はPIG-Netと呼ばれるインセプションに基づくディープネットワークアーキテクチャを提案し,点雲の局所的および大域的幾何学的詳細を効果的に特徴付ける。
我々は2つの最先端データセット上でPIG-Netアーキテクチャの徹底的な実験的解析を行う。
論文 参考訳(メタデータ) (2021-01-28T13:27:55Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Spatiotemporal Graph Neural Network based Mask Reconstruction for Video
Object Segmentation [70.97625552643493]
本稿では,クラス非依存オブジェクトを半教師あり設定でセグメント化するタスクについて述べる。
提案手法のすべてを利用して局所的なコンテキストを捕捉する新しいグラフニューラルネットワーク(TG-Net)を提案する。
論文 参考訳(メタデータ) (2020-12-10T07:57:44Z) - Graph Prototypical Networks for Few-shot Learning on Attributed Networks [72.31180045017835]
グラフメタ学習フレームワーク - Graph Prototypeal Networks (GPN) を提案する。
GPNは、属性付きネットワーク上でテキストミータ学習を行い、ターゲット分類タスクを扱うための高度に一般化可能なモデルを導出する。
論文 参考訳(メタデータ) (2020-06-23T04:13:23Z) - GPS-Net: Graph Property Sensing Network for Scene Graph Generation [91.60326359082408]
シーングラフ生成(SGG)は、画像内のオブジェクトとそれらのペア関係を検出することを目的としている。
GPS-Netは、エッジ方向情報、ノード間の優先度の差、長期にわたる関係の分布という、SGGの3つの特性を網羅している。
GPS-Netは、VG、OI、VRDの3つの一般的なデータベース上での最先端のパフォーマンスを、さまざまな設定とメトリクスで大幅に向上させる。
論文 参考訳(メタデータ) (2020-03-29T07:22:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。