論文の概要: Learning Category- and Instance-Aware Pixel Embedding for Fast Panoptic
Segmentation
- arxiv url: http://arxiv.org/abs/2009.13342v2
- Date: Wed, 16 Jun 2021 01:13:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 22:06:18.573383
- Title: Learning Category- and Instance-Aware Pixel Embedding for Fast Panoptic
Segmentation
- Title(参考訳): 高速パンオプティカルセグメンテーションのための学習カテゴリとインスタンス対応画素埋め込み
- Authors: Naiyu Gao, Yanhu Shan, Xin Zhao, Kaiqi Huang
- Abstract要約: パノプティックセグメンテーション(英: Panoptic segmentation、PS)は、複雑なシーン理解タスクである。
PSの結果は、検出されたインスタンスやモノのクラスに各ピクセルを割り当てることによって、単純に導き出される。
提案手法は,高速な推論速度を示すだけでなく,二段法に匹敵する性能を実現する最初の一段法でもある。
- 参考スコア(独自算出の注目度): 47.26296379603003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panoptic segmentation (PS) is a complex scene understanding task that
requires providing high-quality segmentation for both thing objects and stuff
regions. Previous methods handle these two classes with semantic and instance
segmentation modules separately, following with heuristic fusion or additional
modules to resolve the conflicts between the two outputs. This work simplifies
this pipeline of PS by consistently modeling the two classes with a novel PS
framework, which extends a detection model with an extra module to predict
category- and instance-aware pixel embedding (CIAE). CIAE is a novel pixel-wise
embedding feature that encodes both semantic-classification and
instance-distinction information. At the inference process, PS results are
simply derived by assigning each pixel to a detected instance or a stuff class
according to the learned embedding. Our method not only demonstrates fast
inference speed but also the first one-stage method to achieve comparable
performance to two-stage methods on the challenging COCO benchmark.
- Abstract(参考訳): panoptic segmentation (ps) は複雑なシーン理解タスクであり、モノオブジェクトとモノの領域の両方に高品質なセグメンテーションを提供する必要がある。
従来のメソッドは、これら2つのクラスをセマンティックとインスタンスセグメンテーションモジュールで別々に扱い、ヒューリスティックな融合や追加モジュールによって、2つの出力間の衝突を解決する。
この作業は、カテゴリとインスタンス対応ピクセル埋め込み(ciae)を予測する追加モジュールで検出モデルを拡張する新しいpsフレームワークで、2つのクラスを一貫してモデル化することで、psのパイプラインを単純化する。
CIAEは、セマンティック分類とインスタンス識別情報をエンコードする、新しいピクセル単位の埋め込み機能である。
推論プロセスでは、各ピクセルを、学習した埋め込みに応じて検出されたインスタンスまたは stuffクラスに割り当てることで、ps結果が導出される。
提案手法は高速な推論速度を示すだけでなく,COCOベンチマークにおける2段階法に匹敵する性能を示す最初の1段階法である。
関連論文リスト
- UniParser: Multi-Human Parsing with Unified Correlation Representation Learning [18.372259148872228]
本稿では、インスタンスレベルとカテゴリレベルの表現を3つの重要な側面に統合するUniを紹介する。
UniはMHPv2.0で49.3%AP、CIHPで60.4%APを達成した。
論文 参考訳(メタデータ) (2023-10-13T10:03:01Z) - Masked Cross-image Encoding for Few-shot Segmentation [16.445813548503708]
Few-shot segmentation (FSS) は、注釈付き画像の限られた数だけを用いて、未確認クラスのピクセルワイズラベルを推測することを目的とした、密度の高い予測タスクである。
本研究では,オブジェクトの詳細を記述した共通視覚特性をキャプチャし,特徴の相互作用を高める双方向画像間の依存関係を学習する,Masked Cross-Image MCEという共同学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-22T05:36:39Z) - Semantic-Aware Dual Contrastive Learning for Multi-label Image
Classification [8.387933969327852]
本稿では,サンプル対サンプルのコントラスト学習を取り入れた,セマンティック・アウェアな2つのコントラスト学習フレームワークを提案する。
具体的には、セマンティック・アウェアな表現学習を活用して、カテゴリに関連する局所的識別特徴を抽出する。
提案手法は, 最先端の手法よりも有効であり, 性能も優れている。
論文 参考訳(メタデータ) (2023-07-19T01:57:31Z) - APANet: Adaptive Prototypes Alignment Network for Few-Shot Semantic
Segmentation [56.387647750094466]
Few-shotのセマンティックセマンティックセマンティクスは、指定されたクエリイメージに、ラベル付きサポートイメージのみで、新規クラスのオブジェクトをセグメントすることを目的としている。
ほとんどの高度なソリューションは、各クエリ機能を学習したクラス固有のプロトタイプにマッチさせることでセグメンテーションを実行するメトリクス学習フレームワークを利用している。
本稿では,クラス固有およびクラス非依存のプロトタイプを導入することで,適応型プロトタイプ表現を提案する。
論文 参考訳(メタデータ) (2021-11-24T04:38:37Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - SCNet: Enhancing Few-Shot Semantic Segmentation by Self-Contrastive
Background Prototypes [56.387647750094466]
Few-shot セマンティックセマンティックセマンティクスは,クエリイメージ内の新規クラスオブジェクトを,アノテーション付きの例で分割することを目的としている。
先進的なソリューションのほとんどは、各ピクセルを学習した前景のプロトタイプに合わせることでセグメンテーションを行うメトリクス学習フレームワークを利用している。
このフレームワークは、前景プロトタイプのみとのサンプルペアの不完全な構築のために偏った分類に苦しんでいます。
論文 参考訳(メタデータ) (2021-04-19T11:21:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。