論文の概要: ISDA: Position-Aware Instance Segmentation with Deformable Attention
- arxiv url: http://arxiv.org/abs/2202.12251v1
- Date: Wed, 23 Feb 2022 12:30:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 17:05:52.096991
- Title: ISDA: Position-Aware Instance Segmentation with Deformable Attention
- Title(参考訳): ISDA: 変形可能な注意を伴う位置認識型インスタンスセグメンテーション
- Authors: Kaining Ying, Zhenhua Wang, Cong Bai, Pengfei Zhou
- Abstract要約: 我々はISDAと呼ばれる新しいエンドツーエンドのインスタンスセグメンテーション手法を提案する。
従来の畳み込み操作によって生成されるオブジェクトマスクのセットを予測するために、タスクを再設定する。
提案手法は, セット予測機構によりNMSフリーである。
- 参考スコア(独自算出の注目度): 4.188555841288538
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Most instance segmentation models are not end-to-end trainable due to either
the incorporation of proposal estimation (RPN) as a pre-processing or
non-maximum suppression (NMS) as a post-processing. Here we propose a novel
end-to-end instance segmentation method termed ISDA. It reshapes the task into
predicting a set of object masks, which are generated via traditional
convolution operation with learned position-aware kernels and features of
objects. Such kernels and features are learned by leveraging a deformable
attention network with multi-scale representation. Thanks to the introduced
set-prediction mechanism, the proposed method is NMS-free. Empirically, ISDA
outperforms Mask R-CNN (the strong baseline) by 2.6 points on MS-COCO, and
achieves leading performance compared with recent models. Code will be
available soon.
- Abstract(参考訳): ほとんどのインスタンスセグメンテーションモデルは、前処理として提案推定(rpn)を、後処理として非最大抑制(nms)を組み込んだため、エンドツーエンドのトレーニングはできない。
本稿ではISDAと呼ばれる新しいエンドツーエンドのインスタンスセグメンテーション手法を提案する。
学習された位置認識カーネルとオブジェクトの特徴を備えた従来の畳み込み操作によって生成されるオブジェクトマスクのセットを予測する。
このようなカーネルや機能は、マルチスケール表現を備えた変形可能なアテンションネットワークを活用することで学習される。
提案手法は, セット予測機構によりNMSフリーである。
実証的には、ISDAはMS-COCOでMask R-CNN(強力なベースライン)を2.6ポイント上回っており、最近のモデルと比較して高いパフォーマンスを達成している。
コードはもうすぐ入手できる。
関連論文リスト
- MaskUno: Switch-Split Block For Enhancing Instance Segmentation [0.0]
マスク予測を洗練されたROIを処理し、それらを分類し、特定のマスク予測者に割り当てるスイッチスプリットブロックに置き換えることを提案する。
平均平均精度(mAP)が2.03%上昇し,80クラスにおいて高い成績を示した。
論文 参考訳(メタデータ) (2024-07-31T10:12:14Z) - Complete Instances Mining for Weakly Supervised Instance Segmentation [6.177842623752537]
画像レベルのラベルのみを用いた弱教師付きインスタンスセグメンテーション(WSIS)のための新しい手法を提案する。
我々はMaskIoUヘッドを使用して提案の整合性のスコアを予測するとともに,冗長なセグメンテーション問題を明示的にモデル化するための完全インスタンスマイニング(CIM)戦略を提案する。
弊社のアプローチは、複数のインスタンスや完全なインスタンスをネットワークが認識できるようにし、アンチノイズ戦略を取り入れることで、その堅牢性をさらに向上する。
論文 参考訳(メタデータ) (2024-02-12T13:16:47Z) - UniInst: Unique Representation for End-to-End Instance Segmentation [29.974973664317485]
ボックスフリーでNMSフリーなエンドツーエンドのインスタンスセグメンテーションフレームワークUniInstを提案する。
具体的には、各インスタンスに1つのユニークな表現を動的に割り当てるインスタンス対応1対1の代入スキームを設計する。
これらの技術により、最初のFCNベースのエンドツーエンドインスタンスセグメンテーションフレームワークであるUniInstは、競争力のあるパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-05-25T10:40:26Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - End-to-End Object Detection with Fully Convolutional Network [71.56728221604158]
エンドツーエンド検出を実現するために,分類のための予測対応ワン・ツー・ワン (POTO) ラベルの割り当てを導入する。
局所領域における畳み込みの判別性を向上させるために, 簡易な3次元maxフィルタ(3dmf)を提案する。
エンドツーエンドのフレームワークは,COCOおよびCrowdHumanデータセット上のNMSを用いて,最先端の多くの検出器と競合する性能を実現する。
論文 参考訳(メタデータ) (2020-12-07T09:14:55Z) - Deep Variational Instance Segmentation [7.334808870313923]
State-of-the-artアルゴリズムは、しばしば2つの別々のステージを使用し、最初の1つはオブジェクトの提案を生成し、もう1つは境界を認識して修正する。
完全畳み込みネットワーク(FCN)を直接利用して,インスタンスラベルを予測する新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-22T17:57:49Z) - Boundary-assisted Region Proposal Networks for Nucleus Segmentation [89.69059532088129]
大量の核が混在しているため、機械学習モデルはうまく機能しない。
我々は、堅牢なインスタンスレベルの核分割を実現する境界支援領域提案ネットワーク(BRP-Net)を考案する。
論文 参考訳(メタデータ) (2020-06-04T08:26:38Z) - SOLOv2: Dynamic and Fast Instance Segmentation [102.15325936477362]
パフォーマンスの高いシンプルで直接的で高速なインスタンスセグメンテーションフレームワークを構築しています。
オブジェクトセグメンタのマスクヘッドを動的に学習することで、さらに一歩前進する。
簡単な直接インスタンス分割システムを示し,高速化と精度の両面において,いくつかの最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-03-23T09:44:21Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z) - Conditional Convolutions for Instance Segmentation [109.2706837177222]
我々はCondInstと呼ばれるシンプルだが効果的なインスタンスセグメンテーションフレームワークを提案する。
インスタンスに条件付き動的インスタンス認識ネットワークを採用しています。
本稿では,精度と推論速度の両面で性能の向上を実現するための,より単純なインスタンス分割法を示す。
論文 参考訳(メタデータ) (2020-03-12T08:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。