論文の概要: Salient Object Detection via Bounding-box Supervision
- arxiv url: http://arxiv.org/abs/2205.05245v1
- Date: Wed, 11 May 2022 03:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-13 07:36:40.127416
- Title: Salient Object Detection via Bounding-box Supervision
- Title(参考訳): バウンディングボックスによるサルエント物体検出
- Authors: Mengqi He, Jing Zhang, Wenxin Yu
- Abstract要約: ラベル付け作業の軽減を図るため,バウンディングボックスに基づく弱教師付きサリエンシ検出に取り組んでいる。
予測構造を正規化するために,構造認識型自己教師損失を導入する。
6つのベンチマークRGBサリエンシデータセットの実験結果から,本モデルの有効性が示された。
- 参考スコア(独自算出の注目度): 10.20433609492073
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The success of fully supervised saliency detection models depends on a large
number of pixel-wise labeling. In this paper, we work on bounding-box based
weakly-supervised saliency detection to relieve the labeling effort. Given the
bounding box annotation, we observe that pixels inside the bounding box may
contain extensive labeling noise. However, as a large amount of background is
excluded, the foreground bounding box region contains a less complex
background, making it possible to perform handcrafted features-based saliency
detection with only the cropped foreground region. As the conventional
handcrafted features are not representative enough, leading to noisy saliency
maps, we further introduce structure-aware self-supervised loss to regularize
the structure of the prediction. Further, we claim that pixels outside the
bounding box should be background, thus partial cross-entropy loss function can
be used to accurately localize the accurate background region. Experimental
results on six benchmark RGB saliency datasets illustrate the effectiveness of
our model.
- Abstract(参考訳): 完全教師付き塩分検出モデルの成功は、多数のピクセル単位のラベルに依存する。
本稿では,ラベル付け作業の軽減を図るため,バウンディングボックスに基づく弱教師付きサリエンシ検出について検討する。
境界ボックスアノテーションを考慮すれば、境界ボックス内のピクセルには広範なラベリングノイズが含まれている可能性がある。
しかし、大量の背景が除外されているため、前景境界ボックス領域は、より複雑な背景を含まないため、収穫した前景領域のみを用いて手作りの特徴に基づく塩分検出を行うことができる。
従来の手工芸品の特徴が十分に表現されていないため, ノイズの多いサリエンシマップに導かれるため, さらに, 予測構造を正規化するために, 構造に配慮した自己監督的損失を導入する。
また、バウンディングボックス外の画素は背景であるべきであり、正確な背景領域を正確にローカライズするために部分クロスエントロピー損失関数を用いることができる。
6つのベンチマークRGBサリエンシデータセットの実験結果から,本モデルの有効性が示された。
- 全文 参考訳へのリンク
関連論文リスト
- End-to-End Instance Edge Detection [29.650295133113183]
エッジ検出は長い間、コンピュータビジョンの分野で重要な問題であった。
従来の研究は、カテゴリ非依存またはカテゴリ対応エッジ検出を探索してきた。
本稿では,オブジェクトインスタンスのコンテキストにおけるエッジ検出について検討する。
論文 参考訳(メタデータ) (2022-04-06T15:32:21Z) - ImpDet: Exploring Implicit Fields for 3D Object Detection [74.63774221984725]
我々は、境界ボックス回帰を暗黙の関数として見る新しい視点を導入する。
これは、Implicit DetectionまたはImpDetと呼ばれる提案されたフレームワークにつながります。
我々のImpDetは、異なる局所的な3次元空間の点に特定の値を割り当て、高品質な境界を生成することができる。
論文 参考訳(メタデータ) (2022-03-31T17:52:12Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Robust Visual Tracking by Segmentation [103.87369380021441]
対象範囲を推定することは、視覚的物体追跡において根本的な課題となる。
高精度なセグメンテーションマスクを生成するセグメンテーション中心のトラッキングパイプラインを提案する。
我々のトラッカーは、シーンのターゲットを背景コンテンツと明確に区別するターゲット表現をよりよく学習することができる。
論文 参考訳(メタデータ) (2022-03-21T17:59:19Z) - Location-Free Camouflage Generation Network [82.74353843283407]
カモフラージュ(Camouflage)は一般的な視覚現象で、前景の物体を背景のイメージに隠すことで、人間の目からは一時的に見えなくなる。
本稿では,前景と背景像の高次特徴を融合させ,一つの推論によって結果を生成する,ロケーションフリーなカモフラージュ生成ネットワーク(LCG-Net)を提案する。
実験により,本手法は単一外観領域における最先端技術と同程度に良好であり,完全に見えない可能性が低いが,多外観領域における最先端技術の品質をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2022-03-18T10:33:40Z) - Scribble-based Boundary-aware Network for Weakly Supervised Salient
Object Detection in Remote Sensing Images [10.628932392896374]
スパース・スクリブル・アノテーションからリモートセンシング画像の正当性を予測するために,弱教師付きサルエント・オブジェクト検出フレームワークを提案する。
具体的には,高信頼度オブジェクト境界 (擬似) ラベルによって明示的に制御されるオブジェクト境界意味論を探索する境界対応モジュール (BAM) を設計する。
次に,境界セマンティクスを高次特徴と統合し,スクリブルラベルの監督下での健全な物体検出を誘導する。
論文 参考訳(メタデータ) (2022-02-07T20:32:21Z) - Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。
第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。
本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文 参考訳(メタデータ) (2021-08-10T05:44:23Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Background-Aware Pooling and Noise-Aware Loss for Weakly-Supervised
Semantic Segmentation [27.50216933606052]
バウンディングボックスアノテーションを用いた弱い教師付きセマンティックセグメンテーションの問題に対処する。
背景領域は画像内の一部で知覚的に一貫性があり、オブジェクト境界ボックス内の前景と背景領域を識別するために利用することができる。
ノイズ認識損失(nal)により,誤りラベルに対するネットワークの感受性が低下する。
論文 参考訳(メタデータ) (2021-04-02T06:38:41Z) - FakeMix Augmentation Improves Transparent Object Detection [24.540569928274984]
境界関係の不均衡問題を克服するために、FakeMixと呼ばれる新しいコンテンツ依存データ拡張法を提案する。
また,マルチスケールおよびクロスモダリティ機能を動的にキャプチャ可能な,asppの拡張版であるadaptiveasppも紹介する。
論文 参考訳(メタデータ) (2021-03-24T15:51:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。