論文の概要: A Unified Query-based Paradigm for Camouflaged Instance Segmentation
- arxiv url: http://arxiv.org/abs/2308.07392v2
- Date: Tue, 29 Aug 2023 12:37:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 17:26:24.810164
- Title: A Unified Query-based Paradigm for Camouflaged Instance Segmentation
- Title(参考訳): camouflagedインスタンスセグメンテーションのための統一クエリベースパラダイム
- Authors: Bo Dong, Jialun Pei, Rongrong Gao, Tian-Zhu Xiang, Shuo Wang, Huan
Xiong
- Abstract要約: 本稿では,UQFormer と呼ばれるキャモフラージュされたインスタンスセグメンテーションのための,クエリベースの統合型マルチタスク学習フレームワークを提案する。
本モデルでは,インスタンスセグメンテーションをクエリに基づく直接セット予測問題とみなすが,非最大抑圧のような後処理は不要である。
最先端の14のアプローチと比較して、UQFormerは、camouflagedインスタンスセグメンテーションのパフォーマンスを大幅に改善します。
- 参考スコア(独自算出の注目度): 26.91533966120182
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to the high similarity between camouflaged instances and the background,
the recently proposed camouflaged instance segmentation (CIS) faces challenges
in accurate localization and instance segmentation. To this end, inspired by
query-based transformers, we propose a unified query-based multi-task learning
framework for camouflaged instance segmentation, termed UQFormer, which builds
a set of mask queries and a set of boundary queries to learn a shared composed
query representation and efficiently integrates global camouflaged object
region and boundary cues, for simultaneous instance segmentation and instance
boundary detection in camouflaged scenarios. Specifically, we design a composed
query learning paradigm that learns a shared representation to capture object
region and boundary features by the cross-attention interaction of mask queries
and boundary queries in the designed multi-scale unified learning transformer
decoder. Then, we present a transformer-based multi-task learning framework for
simultaneous camouflaged instance segmentation and camouflaged instance
boundary detection based on the learned composed query representation, which
also forces the model to learn a strong instance-level query representation.
Notably, our model views the instance segmentation as a query-based direct set
prediction problem, without other post-processing such as non-maximal
suppression. Compared with 14 state-of-the-art approaches, our UQFormer
significantly improves the performance of camouflaged instance segmentation.
Our code will be available at https://github.com/dongbo811/UQFormer.
- Abstract(参考訳): Camouflagedインスタンスとバックグラウンドの類似性が高いため、最近提案されたCamouflagedインスタンスセグメンテーション(CIS)は、正確なローカライゼーションとインスタンスセグメンテーションの課題に直面している。
この目的のために、クエリベースのトランスフォーマに触発されて、迷彩インスタンスセグメンテーションのための統一クエリベースのマルチタスク学習フレームワーク、uqformerを提案する。これは、マスククエリの集合と境界クエリの集合を構築し、共有構成されたクエリ表現を学習し、迷彩シナリオにおけるインスタンスセグメンテーションとインスタンス境界検出を同時に行うために、グローバルな迷彩オブジェクト領域と境界手がかりを効率的に統合する。
具体的には、多スケール統合学習変換器デコーダの設計において、マスククエリと境界クエリの相互アテンション相互作用により、オブジェクト領域と境界特徴をキャプチャする共有表現を学習する合成クエリ学習パラダイムを設計する。
そして,学習した合成クエリ表現に基づいて,同時カモフラージュされたインスタンスセグメンテーションとカモフラージュされたインスタンス境界検出のためのトランスフォーマーベースのマルチタスク学習フレームワークを提案する。
特に,本モデルでは,インスタンスセグメンテーションをクエリに基づく直接セット予測問題とみなす。
UQFormerは、14の最先端アプローチと比較して、camouflagedインスタンスセグメンテーションのパフォーマンスを大幅に改善します。
私たちのコードはhttps://github.com/dongbo811/uqformerで利用可能です。
関連論文リスト
- DQFormer: Towards Unified LiDAR Panoptic Segmentation with Decoupled Queries [14.435906383301555]
本稿では,統合ワークフローにセマンティックとインスタンスセグメンテーションを実装するDQFormerという新しいフレームワークを提案する。
具体的には,セマンティクスを用いた情報的クエリを局所化して提案する,疎結合なクエリジェネレータを設計する。
また、クエリ指向マスクデコーダを導入し、対応するセグメンテーションマスクをデコードする。
論文 参考訳(メタデータ) (2024-08-28T14:14:33Z) - Temporal-aware Hierarchical Mask Classification for Video Semantic
Segmentation [62.275143240798236]
ビデオセマンティックセグメンテーションデータセットは、ビデオ毎のカテゴリが限られている。
VSSトレーニング中に意味のある勾配更新を受けるために、クエリの10%未満がマッチする可能性がある。
提案手法は,最新のVSSベンチマークVSPWにおいてベルやホイッスルを使わずに,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-09-14T20:31:06Z) - Learning Equivariant Segmentation with Instance-Unique Querying [47.52528819153683]
我々は、差別的なクエリ埋め込み学習を通じて、クエリベースのモデルを強化する新しいトレーニングフレームワークを考案した。
我々のアルゴリズムは、トレーニングデータセット全体から対応するインスタンスを検索するためにクエリを使用します。
4つの有名なクエリベースのモデルに加えて、トレーニングアルゴリズムは大きなパフォーマンス向上を提供します。
論文 参考訳(メタデータ) (2022-10-03T13:14:00Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - SOLQ: Segmenting Objects by Learning Queries [33.02115826341877]
SOLQでは、各クエリは1つのオブジェクトを表し、クラス、ロケーション、マスクの複数の表現を持つ。
SOLQは最先端のパフォーマンスを達成でき、既存のアプローチの多くを上回ります。
統合クエリ表現の合同学習は、元のDETRの検出性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-06-04T09:03:31Z) - QueryInst: Parallelly Supervised Mask Query for Instance Segmentation [53.5613957875507]
本稿では,動的マスクヘッドの並列監視によるクエリベースインスタンスセグメンテーション手法であるqueryinstを提案する。
COCO、CityScapes、YouTube-VISの3つの挑戦的なベンチマークについて広範な実験を行っています。
QueryInstは、すべてのオンラインVISアプローチの中で最高のパフォーマンスを達成し、十分なスピード精度のトレードオフを打ち負かす。
論文 参考訳(メタデータ) (2021-05-05T08:38:25Z) - The Devil is in the Boundary: Exploiting Boundary Representation for
Basis-based Instance Segmentation [85.153426159438]
本研究では,既存のグローバルマスクベースの手法を補完するグローバル境界表現を学習するために,Basisベースのインスタンス(B2Inst)を提案する。
私たちのB2Instは一貫した改善をもたらし、シーン内のインスタンス境界を正確に解析します。
論文 参考訳(メタデータ) (2020-11-26T11:26:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。