論文の概要: Weakly-supervised Instance Segmentation via Class-agnostic Learning with
Salient Images
- arxiv url: http://arxiv.org/abs/2104.01526v1
- Date: Sun, 4 Apr 2021 03:01:52 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-07 08:00:22.269134
- Title: Weakly-supervised Instance Segmentation via Class-agnostic Learning with
Salient Images
- Title(参考訳): 正規画像を用いたクラス非依存学習による弱教師付きインスタンスセグメンテーション
- Authors: Xinggang Wang and Jiapei Feng and Bin Hu and Qi Ding and Longjin Ran
and Xiaoxin Chen and Wenyu Liu
- Abstract要約: 弱教師付きインスタンスセグメンテーションのためのbox-supervised class-agnostic object segmentation (boxcaseg) ベースのソリューションを提案する。
BoxCasegモデルは、マルチタスクの学習方法でボックス監視画像とサリエント画像を使用して共同トレーニングされます。
弱い教師付きMask R-CNNはPASCAL VOC上の完全に教師付きMask R-CNNと同等であり、COCO上の最先端のボックス管理インスタンスセグメンテーション手法よりも大幅に優れている。
- 参考スコア(独自算出の注目度): 34.498542318157284
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans have a strong class-agnostic object segmentation ability and can
outline boundaries of unknown objects precisely, which motivates us to propose
a box-supervised class-agnostic object segmentation (BoxCaseg) based solution
for weakly-supervised instance segmentation. The BoxCaseg model is jointly
trained using box-supervised images and salient images in a multi-task learning
manner. The fine-annotated salient images provide class-agnostic and precise
object localization guidance for box-supervised images. The object masks
predicted by a pretrained BoxCaseg model are refined via a novel merged and
dropped strategy as proxy ground truth to train a Mask R-CNN for
weakly-supervised instance segmentation. Only using $7991$ salient images, the
weakly-supervised Mask R-CNN is on par with fully-supervised Mask R-CNN on
PASCAL VOC and significantly outperforms previous state-of-the-art
box-supervised instance segmentation methods on COCO. The source code,
pretrained models and datasets are available at
\url{https://github.com/hustvl/BoxCaseg}.
- Abstract(参考訳): 人間は強力なクラス非依存のオブジェクトセグメンテーション能力を持ち、未知のオブジェクトの境界を正確に概説できるため、弱い教師付きインスタンスセグメンテーションのためのボックス教師付きクラス非依存のオブジェクトセグメンテーション(BoxCaseg)ベースのソリューションを提案する動機となる。
boxcasegモデルは、複数タスクの学習方法で、box-supervised imageとsaient imagesを使って共同でトレーニングされる。
詳細な注釈付きサルエント画像は、ボックス教師付き画像に対して、クラス非依存で正確なオブジェクトローカライゼーションガイダンスを提供する。
事前訓練されたBoxCasegモデルによって予測されるオブジェクトマスクは、弱教師付きインスタンスセグメンテーションのためにMask R-CNNをトレーニングするためのプロキシ基底真理として、新しいマージおよびドロップ戦略によって洗練される。
7991ドル(約7万9800円)の高解像度画像のみを使用して、弱教師付きMask R-CNNはPASCAL VOC上の完全に教師付きMask R-CNNと同等であり、COCO上の最先端のボックス管理インスタンスセグメンテーション手法よりも大幅に優れています。
ソースコード、事前トレーニングされたモデル、データセットは \url{https://github.com/hustvl/boxcaseg} で入手できる。
関連論文リスト
- Boosting Unsupervised Semantic Segmentation with Principal Mask Proposals [15.258631373740686]
教師なしセマンティックセグメンテーションは、画像コーパス内のグローバルセマンティックカテゴリをアノテーションなしで識別することで、画像を自動的に意味のある領域に分割することを目的としている。
そこで,PriMaP - 主マスク提案 - 特徴表現に基づいてイメージを意味的に意味のあるマスクに分解する。
これにより、予測最大化アルゴリズムであるPriMaPs-EMを用いて、クラスプロトタイプをPriMaPsに適合させることで、教師なしセマンティックセマンティックセマンティクスを実現することができる。
論文 参考訳(メタデータ) (2024-04-25T17:58:09Z) - Mask-free OVIS: Open-Vocabulary Instance Segmentation without Manual
Mask Annotations [86.47908754383198]
Open-Vocabulary (OV) 法は、大規模な画像キャプチャペアと視覚言語モデルを利用して、新しいカテゴリを学習する。
提案手法は,イメージキャプションペアに存在するオブジェクトに対して,事前学習された視覚言語モデルの局所化能力を活用することで,擬似マスクアノテーションを生成する。
擬似マスクを用いてトレーニングした手法は,MS-COCOデータセットとOpenImagesデータセットのmAPスコアを大幅に改善する。
論文 参考訳(メタデータ) (2023-03-29T17:58:39Z) - Learning Open-vocabulary Semantic Segmentation Models From Natural
Language Supervision [49.905448429974804]
オープン語彙セマンティックセマンティックセグメンテーション(OVS)は,事前に定義された閉集合のカテゴリではなく,任意のクラスのオブジェクトをセグメンテーションすることを目的としている。
OVSegmentorと呼ばれるOVSのトランスフォーマーベースモデルを提案する。
プレトレーニングには3%のデータ(4M vs 134M)のみを用いることで,最先端手法よりも優れたセグメンテーション結果が得られる。
論文 参考訳(メタデータ) (2023-01-22T13:10:05Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Exploiting Shape Cues for Weakly Supervised Semantic Segmentation [15.791415215216029]
弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は、画像レベルのラベルのみをトレーニング用として、画素単位のクラス予測を生成することを目的としている。
畳み込みニューラルネットワーク(CNN)のテクスチャバイアス特性を補うために形状情報を活用することを提案する。
我々は、クラスと色親和性の両方を考慮した新しい改良手法により、オンライン方式で予測をさらに洗練する。
論文 参考訳(メタデータ) (2022-08-08T17:25:31Z) - GANSeg: Learning to Segment by Unsupervised Hierarchical Image
Generation [16.900404701997502]
本稿では,潜伏マスクに条件付き画像を生成するGANベースのアプローチを提案する。
このようなマスク条件の画像生成は、マスクを階層的に条件付ける際に忠実に学習できることを示す。
また、セグメンテーションネットワークをトレーニングするためのイメージマスクペアの生成も可能で、既存のベンチマークでは、最先端の教師なしセグメンテーションメソッドよりも優れています。
論文 参考訳(メタデータ) (2021-12-02T07:57:56Z) - Box-Adapt: Domain-Adaptive Medical Image Segmentation using Bounding
BoxSupervision [52.45336255472669]
深層学習のための弱教師付きドメイン適応設定を提案する。
Box-Adaptは、ソースドメインのきめ細かいセグナオンマスクとターゲットドメインの弱いバウンディングボックスを完全に探索する。
肝セグメンテーションにおける本手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-08-19T01:51:04Z) - BBAM: Bounding Box Attribution Map for Weakly Supervised Semantic and
Instance Segmentation [19.55647093153416]
バウンディングボックスアノテーションを用いた弱い教師付きセグメンテーション手法は、オブジェクトを含む各ボックスからピクセルレベルのマスクを取得することに焦点を当てている。
本研究では,対象検出器が生成する画像の最小領域を画像全体とほぼ同程度に求めることにより,訓練対象検出器の挙動から得られる高次情報を利用する。
これらの領域はバウンディングボックスアトリビューションマップ(bbam)を構成しており、バウンディングボックス内の対象オブジェクトを識別し、弱い教師付きセマンティクスとcocoインスタンスセグメンテーションのための擬似基底となる。
論文 参考訳(メタデータ) (2021-03-16T08:29:33Z) - Learning Class-Agnostic Pseudo Mask Generation for Box-Supervised
Semantic Segmentation [156.9155100983315]
ボックス教師付きセマンティクスセグメンテーションに合わせた,より正確な学習ベースのクラス非依存な擬似マスクジェネレータを求める。
この方法は、ボックス監視モデルとフル監視モデルの間のパフォーマンスギャップをさらに埋めることができます。
論文 参考訳(メタデータ) (2021-03-09T14:54:54Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Prior to Segment: Foreground Cues for Weakly Annotated Classes in
Partially Supervised Instance Segmentation [3.192503074844774]
部分教師付きインスタンスセグメンテーションは、より豊富な弱いボックスラベルを利用することで、限られたマスクラベルによるマスク予測を改善することを目的としている。
部分教師付きインスタンスセグメンテーションで一般的に使用されるクラス非依存マスクヘッドは,弱アノテーションクラスに対する一般的な前景概念の学習が困難であることを示す。
我々は,すべてのクラスを監督するボックス分類ヘッドによって暗黙的に学習される前景の一般的な概念をマスクヘッドに提供する,OMP(object mask prior)を導入する。
論文 参考訳(メタデータ) (2020-11-23T23:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。