論文の概要: 3SD: Self-Supervised Saliency Detection With No Labels
- arxiv url: http://arxiv.org/abs/2203.04478v1
- Date: Wed, 9 Mar 2022 01:40:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 04:57:17.656522
- Title: 3SD: Self-Supervised Saliency Detection With No Labels
- Title(参考訳): 3SD:ラベルなしのセルフ・スーパービジョン・サリエンシ検出
- Authors: Rajeev Yasarla, Renliang Weng, Wongun Choi, Vishal Patel, and Amir
Sadeghian
- Abstract要約: 本稿では,概念的にシンプルな塩分濃度検出手法を提案する。
本手法では, 擬似地下真実ラベルを学習に用いた。
- 参考スコア(独自算出の注目度): 19.260185488168982
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a conceptually simple self-supervised method for saliency
detection. Our method generates and uses pseudo-ground truth labels for
training. The generated pseudo-GT labels don't require any kind of human
annotations (e.g., pixel-wise labels or weak labels like scribbles). Recent
works show that features extracted from classification tasks provide important
saliency cues like structure and semantic information of salient objects in the
image. Our method, called 3SD, exploits this idea by adding a branch for a
self-supervised classification task in parallel with salient object detection,
to obtain class activation maps (CAM maps). These CAM maps along with the edges
of the input image are used to generate the pseudo-GT saliency maps to train
our 3SD network. Specifically, we propose a contrastive learning-based training
on multiple image patches for the classification task. We show the multi-patch
classification with contrastive loss improves the quality of the CAM maps
compared to naive classification on the entire image. Experiments on six
benchmark datasets demonstrate that without any labels, our 3SD method
outperforms all existing weakly supervised and unsupervised methods, and its
performance is on par with the fully-supervised methods. Code is available at
:https://github.com/rajeevyasarla/3SD
- Abstract(参考訳): 本稿では,概念的にシンプルな塩分濃度検出手法を提案する。
本手法は,擬似地下真実ラベルをトレーニングに用いた。
生成された疑似gtラベルは、人間のアノテーション(ピクセル単位でのラベルやスクリブルのような弱いラベルなど)を必要としない。
最近の研究では、分類タスクから抽出された特徴が、画像中のサルエントオブジェクトの構造や意味情報といった重要なサルエンシー手がかりを提供することが示された。
提案手法は3SDと呼ばれる手法を用いて,クラスアクティベーションマップ(CAMマップ)を得るために,有能なオブジェクト検出と並行して,自己教師付き分類タスクのブランチを追加する。
これらのCAMマップと入力画像のエッジは、3Dネットワークをトレーニングするために擬似GTサリエンシマップを生成するために使用される。
具体的には,分類タスクのための複数の画像パッチを用いたコントラスト学習に基づくトレーニングを提案する。
比較的損失を伴うマルチパッチ分類は,画像全体のナイーブ分類と比較してCAMマップの品質を向上させる。
6つのベンチマークデータセットの実験では、ラベルなしでは、我々の3SDメソッドは既存の弱教師付きおよび非教師付きメソッドよりも優れており、その性能は完全な教師付きメソッドと同等である。
コードはhttps://github.com/rajeevyasarla/3sdで入手できる。
関連論文リスト
- You Only Need One Thing One Click: Self-Training for Weakly Supervised
3D Scene Understanding [107.06117227661204]
私たちはOne Thing One Click''を提案する。つまり、アノテーションはオブジェクトごとに1つのポイントをラベル付けするだけです。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
我々のモデルは、ポイントクラスタリング戦略を備えた3Dインスタンスセグメンテーションと互換性がある。
論文 参考訳(メタデータ) (2023-03-26T13:57:00Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - An Empirical Study of Pseudo-Labeling for Image-based 3D Object
Detection [72.30883544352918]
異なる条件下で,擬似ラベルがベースラインモデルに対して効果的に監視できるかどうかを検討する。
ベルとホイッスルを使わずにKITTI-3Dテストセットの適度なレベルを20.23 APで達成し、ベースラインモデルを6.03 APで改善した。
この研究が、半教師付き環境下で画像に基づく3D検出コミュニティに洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2022-08-15T12:17:46Z) - Mixed Supervision Learning for Whole Slide Image Classification [88.31842052998319]
超高解像度画像のための混合監視学習フレームワークを提案する。
パッチトレーニングの段階では、このフレームワークは、粗いイメージレベルのラベルを使用して、自己教師付き学習を洗練することができる。
画素レベルの偽陽性と偽陰性を抑制するための包括的な戦略が提案されている。
論文 参考訳(メタデータ) (2021-07-02T09:46:06Z) - One Thing One Click: A Self-Training Approach for Weakly Supervised 3D
Semantic Segmentation [78.36781565047656]
私たちは、アノテーションーがオブジェクトごとに1ポイントだけラベルを付ける必要があることを意味する「One Thing One Click」を提案します。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
私たちの結果は、完全に監督されたものと同等です。
論文 参考訳(メタデータ) (2021-04-06T02:27:25Z) - Weakly-Supervised Image Semantic Segmentation Using Graph Convolutional
Networks [9.066817971329899]
画像レベルクラスラベルに基づく弱教師付き画像意味セグメンテーション
このタスクの一般的なアプローチは、ランダムウォーク機構を用いてクラス活性化マップ(CAM)のアクティベーションスコアを伝搬することである。
グラフ畳み込みネットワーク(GCN)に基づく特徴伝達フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-31T02:05:01Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Unsupervised Self-training Algorithm Based on Deep Learning for Optical
Aerial Images Change Detection [17.232244800511523]
本稿では,光学的空中画像変化検出のための教師なし自己学習アルゴリズム(USTA)を提案する。
アルゴリズム全体のプロセスは、手動でマークされたラベルなしで教師なしのプロセスである。
実データを用いた実験により,提案手法の競合性能が示された。
論文 参考訳(メタデータ) (2020-10-15T01:51:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。