論文の概要: Weakly-Supervised Salient Object Detection Using Point Supervison
- arxiv url: http://arxiv.org/abs/2203.11652v1
- Date: Tue, 22 Mar 2022 12:16:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-23 20:52:22.655948
- Title: Weakly-Supervised Salient Object Detection Using Point Supervison
- Title(参考訳): ポイントスーパーバイソンを用いた弱スーパーバイザ・サリアント物体検出
- Authors: Shuyong Gao, Wei Zhang, Yan Wang, Qianyu Guo, Chenglong Zhang, Yangji
He, Wenqiang Zhang
- Abstract要約: 現在の最先端の精度検出モデルは、正確なピクセル単位のアノテーションの大規模なデータセットに大きく依存している。
本稿では,ポイント・インスペクタを用いた弱教師付きサルエント・オブジェクト検出手法を提案する。
我々の手法は、より強い監督力で訓練された従来の最先端の手法よりも優れています。
- 参考スコア(独自算出の注目度): 17.88596733603456
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current state-of-the-art saliency detection models rely heavily on large
datasets of accurate pixel-wise annotations, but manually labeling pixels is
time-consuming and labor-intensive. There are some weakly supervised methods
developed for alleviating the problem, such as image label, bounding box label,
and scribble label, while point label still has not been explored in this
field. In this paper, we propose a novel weakly-supervised salient object
detection method using point supervision. To infer the saliency map, we first
design an adaptive masked flood filling algorithm to generate pseudo labels.
Then we develop a transformer-based point-supervised saliency detection model
to produce the first round of saliency maps. However, due to the sparseness of
the label, the weakly supervised model tends to degenerate into a general
foreground detection model. To address this issue, we propose a Non-Salient
Suppression (NSS) method to optimize the erroneous saliency maps generated in
the first round and leverage them for the second round of training. Moreover,
we build a new point-supervised dataset (P-DUTS) by relabeling the DUTS
dataset. In P-DUTS, there is only one labeled point for each salient object.
Comprehensive experiments on five largest benchmark datasets demonstrate our
method outperforms the previous state-of-the-art methods trained with the
stronger supervision and even surpass several fully supervised state-of-the-art
models. The code is available at: https://github.com/shuyonggao/PSOD.
- Abstract(参考訳): 現在の最先端の精度検出モデルは、正確なピクセル単位のアノテーションの大規模なデータセットに大きく依存しているが、手動でピクセルをラベル付けするのは時間と労力を要する。
イメージラベルやバウンディングボックスラベル,スクリブルラベルなど,この問題を軽減するための弱教師付き手法がいくつか開発されているが,点ラベルについてはいまだ検討されていない。
本稿では,点監視を用いた新しい弱教師付きサルエント物体検出法を提案する。
そこで我々はまず,適応型マスク付き洪水充填アルゴリズムを設計し,擬似ラベルを生成する。
次に, 点教師付きサリエンシー検出モデルを開発し, 第1ラウンドのサリエンシーマップを作成する。
しかし,ラベルの疎度のため,弱教師付きモデルは一般的な前景検出モデルに縮退する傾向にある。
この問題に対処するため,第1ラウンドで生成した誤ったサリエンシマップを最適化し,第2ラウンドのトレーニングに活用する非サリエント抑圧法を提案する。
さらに, DUTSデータセットを緩和することにより, 新たなP-DUTSデータセットを構築する。
p-dutsでは、各salientオブジェクトのラベル付きポイントは1つだけである。
5つの大規模ベンチマークデータセットに関する包括的実験は、より強い監督の下で訓練された以前の最先端の手法よりも優れており、さらにいくつかの完全に監視された最先端のモデルを超えていることを示している。
コードはhttps://github.com/shuyonggao/psodで入手できる。
関連論文リスト
- Sparse Generation: Making Pseudo Labels Sparse for weakly supervision with points [2.2241974678268903]
モデルのスパース出力の結果、弱教師付き擬似ラベルの生成を考える。
擬似ラベルをスパース化するスパース生成法を提案する。
論文 参考訳(メタデータ) (2024-03-28T10:42:49Z) - LabelFormer: Object Trajectory Refinement for Offboard Perception from
LiDAR Point Clouds [37.87496475959941]
オフボード認識モデルは、生のLiDARポイントクラウドからアノテーションを自動的に生成するように訓練されている。
本稿では,単純で効率的かつ効果的な軌道レベルの改良手法である LabelFormer を提案する。
提案手法はまず,まず各フレームの観察を別々に符号化し,その後,時間的文脈の完全な軌跡を判断するために自己注意を利用する。
論文 参考訳(メタデータ) (2023-11-02T17:56:06Z) - Learning Remote Sensing Object Detection with Single Point Supervision [17.12725535531483]
Pointly Supervised Object Detection (PSOD) は、ボックスレベルの監視対象検出と比較してラベリングコストが低いため、かなりの関心を集めている。
本研究では,RS画像に適したPSOD法を提案する。
提案手法は,最先端の画像レベルとポイントレベルの教師付き検出法と比較して性能が大幅に向上し,PSODとボックスレベルの教師付きオブジェクト検出の差を低減できる。
論文 参考訳(メタデータ) (2023-05-23T15:06:04Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - Weakly Supervised Monocular 3D Object Detection using Multi-View
Projection and Direction Consistency [78.76508318592552]
モノクロ3Dオブジェクト検出は、その容易なアプリケーションのための自動駆動において、主流のアプローチとなっている。
現在のほとんどの方法は、トレーニングフェーズで使用される真実をラベル付けするために、まだ3Dポイントのクラウドデータに依存しています。
画像にマークされた2次元ラベルだけでモデルを訓練できる,弱教師付きモノクル3次元オブジェクト検出法を提案する。
論文 参考訳(メタデータ) (2023-03-15T15:14:00Z) - Unsupervised Object Detection with LiDAR Clues [70.73881791310495]
本稿では,LiDARの手がかりを用いた非教師対象検出のための最初の実用的手法を提案する。
提案手法では,まず3次元点雲に基づく候補オブジェクトセグメントを生成する。
そして、セグメントラベルを割り当て、セグメントラベルネットワークを訓練する反復的なセグメントラベル処理を行う。
ラベル付けプロセスは、長い尾とオープンエンドの分布の問題を軽減するために慎重に設計されている。
論文 参考訳(メタデータ) (2020-11-25T18:59:54Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。