論文の概要: Disentangle Saliency Detection into Cascaded Detail Modeling and Body
Filling
- arxiv url: http://arxiv.org/abs/2202.04112v1
- Date: Tue, 8 Feb 2022 19:33:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 15:12:56.745717
- Title: Disentangle Saliency Detection into Cascaded Detail Modeling and Body
Filling
- Title(参考訳): カスケードディテールモデリングと体充填における不連続塩分検出
- Authors: Yue Song, Hao Tang, Nicu Sebe, Wei Wang
- Abstract要約: 本稿では,サリエンシ検出タスクを2つのサブタスク,すなわち詳細モデリングとボディフィリングに分解することを提案する。
具体的には、詳細モデリングは、明示的に分解された詳細ラベルの監督によってオブジェクトエッジをキャプチャすることに焦点を当てる。
ボディフィリングは、ディテールマップに充填されるボディ部分を学び、より正確なサリエンシマップを生成する。
- 参考スコア(独自算出の注目度): 68.73040261040539
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Salient object detection has been long studied to identify the most visually
attractive objects in images/videos. Recently, a growing amount of approaches
have been proposed all of which rely on the contour/edge information to improve
detection performance. The edge labels are either put into the loss directly or
used as extra supervision. The edge and body can also be learned separately and
then fused afterward. Both methods either lead to high prediction errors near
the edge or cannot be trained in an end-to-end manner. Another problem is that
existing methods may fail to detect objects of various sizes due to the lack of
efficient and effective feature fusion mechanisms. In this work, we propose to
decompose the saliency detection task into two cascaded sub-tasks, \emph{i.e.},
detail modeling and body filling. Specifically, the detail modeling focuses on
capturing the object edges by supervision of explicitly decomposed detail label
that consists of the pixels that are nested on the edge and near the edge. Then
the body filling learns the body part which will be filled into the detail map
to generate more accurate saliency map. To effectively fuse the features and
handle objects at different scales, we have also proposed two novel multi-scale
detail attention and body attention blocks for precise detail and body
modeling. Experimental results show that our method achieves state-of-the-art
performances on six public datasets.
- Abstract(参考訳): サルエント物体検出は、画像やビデオの中で最も視覚的に魅力的な物体を特定するために長い間研究されてきた。
近年,検出性能を向上させるために輪郭・エッジ情報に依存する手法が多数提案されている。
エッジラベルは損失に直接置かれるか、追加の監視として使用される。
エッジとボディは別々に学習し、その後に融合することもできる。
どちらの手法もエッジ付近で高い予測エラーを発生させるか、エンドツーエンドでトレーニングすることはできない。
もう一つの問題は、既存の手法が効率的な機能融合機構が欠如しているため、様々な大きさの物体を検出できないことである。
本研究では,サリエンシ検出タスクを2つのカスケードされたサブタスク, \emph{i.e.}, 詳細モデリングとボディフィリングに分解することを提案する。
特に、ディテールモデリングは、エッジとエッジの近傍にネストされたピクセルからなる明示的に分解されたディテールラベルの監督によって、オブジェクトエッジをキャプチャすることに焦点を当てている。
そして、体充填は、細部マップに充填される体部を学習し、より正確な塩分マップを生成する。
特徴を効果的に融合させ,物体を異なるスケールで扱えるようにするために,複数スケールの細部注意ブロックと細部細部モデリングのためのボディアテンションブロックも提案した。
実験結果から,提案手法は6つの公開データセット上で最先端の性能を実現する。
関連論文リスト
- Local Occupancy-Enhanced Object Grasping with Multiple Triplanar Projection [24.00828999360765]
本稿では,一般的な物体をロボットでつかむという課題に対処する。
提案したモデルはまず、シーン内で最も可能性の高いいくつかの把握ポイントを提案する。
各グリップポイントの周囲に、モジュールはその近傍にある任意のボクセルが空か、ある物体に占有されているかを推測するように設計されている。
モデルはさらに、局所占有力向上した物体形状情報を利用して、6-DoFグリップポーズを推定する。
論文 参考訳(メタデータ) (2024-07-22T16:22:28Z) - Few-shot Oriented Object Detection with Memorable Contrastive Learning in Remote Sensing Images [11.217630579076237]
リモートセンシングの分野では、FSOD(Few-shot Object Detection)が注目されている。
本稿では,Few-shot Oriented Object Detection with Memorable Contrastive Learning (FOMC) という,リモートセンシングのための新しいFSOD法を提案する。
具体的には、従来の水平有界ボックスの代わりに指向的有界ボックスを用いて、任意指向の空中オブジェクトのより優れた特徴表現を学習する。
論文 参考訳(メタデータ) (2024-03-20T08:15:18Z) - Joint Perceptual Learning for Enhancement and Object Detection in
Underwater Scenarios [41.34564703212461]
水中物体検出と画像強調を共同で学習する二段階最適化法を提案する。
本手法は,視覚的に有利な画像と高い検出精度を出力する。
論文 参考訳(メタデータ) (2023-07-07T11:54:06Z) - Sharp Eyes: A Salient Object Detector Working The Same Way as Human
Visual Characteristics [3.222802562733787]
本稿では,まず被写体をシーンから分離し,それを細分化するシャープアイネットワーク(SENet)を提案する。
提案手法は,拡張オブジェクトを用いてネットワークを誘導し,完全な予測を行う。
論文 参考訳(メタデータ) (2023-01-18T11:00:45Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - Ensembling object detectors for image and video data analysis [98.26061123111647]
本稿では,複数の物体検出器の出力をアンサンブルすることで,画像データ上の境界ボックスの検出性能と精度を向上させる手法を提案する。
本研究では,2段階追跡に基づく検出精度向上手法を提案することで,映像データに拡張する。
論文 参考訳(メタデータ) (2021-02-09T12:38:16Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Refined Plane Segmentation for Cuboid-Shaped Objects by Leveraging Edge
Detection [63.942632088208505]
本稿では,セグメント化された平面マスクを画像に検出されたエッジと整列するための後処理アルゴリズムを提案する。
これにより、立方体形状の物体に制限を加えながら、最先端のアプローチの精度を高めることができます。
論文 参考訳(メタデータ) (2020-03-28T18:51:43Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。