論文の概要: Label Decoupling Framework for Salient Object Detection
- arxiv url: http://arxiv.org/abs/2008.11048v1
- Date: Tue, 25 Aug 2020 14:23:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 04:00:25.674287
- Title: Label Decoupling Framework for Salient Object Detection
- Title(参考訳): 健全物体検出のためのラベルデカップリングフレームワーク
- Authors: Jun Wei, Shuhui Wang, Zhe Wu, Chi Su, Qingming Huang, Qi Tian
- Abstract要約: 近年の手法は, 畳み込みネットワーク(FCN)からの多層的特徴の集約と, エッジ情報の導入に重点を置いている。
ラベルデカップリング手順と機能相互作用ネットワーク(FIN)からなるラベルデカップリングフレームワーク(LDF)を提案する。
6つのベンチマークデータセットの実験では、LDFはさまざまな評価指標における最先端のアプローチよりも優れていることが示されている。
- 参考スコア(独自算出の注目度): 157.96262922808245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To get more accurate saliency maps, recent methods mainly focus on
aggregating multi-level features from fully convolutional network (FCN) and
introducing edge information as auxiliary supervision. Though remarkable
progress has been achieved, we observe that the closer the pixel is to the
edge, the more difficult it is to be predicted, because edge pixels have a very
imbalance distribution. To address this problem, we propose a label decoupling
framework (LDF) which consists of a label decoupling (LD) procedure and a
feature interaction network (FIN). LD explicitly decomposes the original
saliency map into body map and detail map, where body map concentrates on
center areas of objects and detail map focuses on regions around edges. Detail
map works better because it involves much more pixels than traditional edge
supervision. Different from saliency map, body map discards edge pixels and
only pays attention to center areas. This successfully avoids the distraction
from edge pixels during training. Therefore, we employ two branches in FIN to
deal with body map and detail map respectively. Feature interaction (FI) is
designed to fuse the two complementary branches to predict the saliency map,
which is then used to refine the two branches again. This iterative refinement
is helpful for learning better representations and more precise saliency maps.
Comprehensive experiments on six benchmark datasets demonstrate that LDF
outperforms state-of-the-art approaches on different evaluation metrics.
- Abstract(参考訳): 近年,完全畳み込みネットワーク(FCN)から多段階特徴を集約し,エッジ情報を補助的監視として導入する手法が注目されている。
画期的な進歩は達成されているが、エッジのピクセルがエッジに近いほど、エッジのピクセルは非常に不均衡な分布であるため、予測が難しくなるのが観察されている。
この問題に対処するために,ラベルデカップリング(LD)プロシージャと機能相互作用ネットワーク(FIN)で構成されるラベルデカップリングフレームワーク(LDF)を提案する。
ldは、元の塩分マップをボディマップとディテールマップに明示的に分解し、ボディマップはオブジェクトの中心領域に集中し、ディテールマップはエッジ周辺の領域に集中する。
細部マップは、従来のエッジ監視よりもピクセルが多いので、うまく機能する。
鮮度マップと異なり、ボディマップはエッジピクセルを捨て、中心領域にのみ注意を払う。
これはトレーニング中のエッジピクセルからの邪魔をうまく回避する。
したがって, ボディマップとディテールマップをそれぞれ扱うために, フィンに2つの分枝を用いる。
特徴相互作用 (FI) は2つの補足枝を融合させて唾液マップを予測し、2つの枝を再び精製するために使用される。
この反復的な洗練は、より良い表現とより正確な正当性マップを学ぶのに役立つ。
6つのベンチマークデータセットの総合的な実験により、LDFは様々な評価指標における最先端のアプローチよりも優れていることが示された。
関連論文リスト
- Image-based Geolocalization by Ground-to-2.5D Map Matching [21.21416396311102]
地上視のクエリ画像と2Dマップをマッチングするために、クロスビューのローカライゼーション技術を利用することが多い。
マルチモーダルデータから代表埋め込みを学習するための新しい手法を提案する。
本手法は,重要な幾何学的手がかりを符号化することにより,パノラマ画像と地図のマッチングのための識別的位置埋め込みを学習する。
論文 参考訳(メタデータ) (2023-08-11T08:00:30Z) - NeMO: Neural Map Growing System for Spatiotemporal Fusion in
Bird's-Eye-View and BDD-Map Benchmark [9.430779563669908]
視覚中心のBird's-Eye View表現は自律運転システムに不可欠である。
この研究は、読みやすく、説明可能なビッグマップを利用してローカルマップを生成するための、NeMOという新しいパラダイムを概説する。
すべてのBEVグリッドの特徴分布が同じパターンに従うと仮定して、すべてのグリッドに対して共有重み付きニューラルネットワークを採用して、ビッグマップを更新する。
論文 参考訳(メタデータ) (2023-06-07T15:46:15Z) - Sharp Eyes: A Salient Object Detector Working The Same Way as Human
Visual Characteristics [3.222802562733787]
本稿では,まず被写体をシーンから分離し,それを細分化するシャープアイネットワーク(SENet)を提案する。
提案手法は,拡張オブジェクトを用いてネットワークを誘導し,完全な予測を行う。
論文 参考訳(メタデータ) (2023-01-18T11:00:45Z) - Learning Implicit Feature Alignment Function for Semantic Segmentation [51.36809814890326]
Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-06-17T09:40:14Z) - Disentangle Saliency Detection into Cascaded Detail Modeling and Body
Filling [68.73040261040539]
本稿では,サリエンシ検出タスクを2つのサブタスク,すなわち詳細モデリングとボディフィリングに分解することを提案する。
具体的には、詳細モデリングは、明示的に分解された詳細ラベルの監督によってオブジェクトエッジをキャプチャすることに焦点を当てる。
ボディフィリングは、ディテールマップに充填されるボディ部分を学び、より正確なサリエンシマップを生成する。
論文 参考訳(メタデータ) (2022-02-08T19:33:02Z) - Structure-Consistent Weakly Supervised Salient Object Detection with
Local Saliency Coherence [14.79639149658596]
本論文では,スクリブルアノテーションによる弱監督オブジェクト検出のための1ラウンドのエンドツーエンドトレーニング手法を提案する。
6つのベンチマークで最新のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2020-12-08T12:49:40Z) - Rethinking Localization Map: Towards Accurate Object Perception with
Self-Enhancement Maps [78.2581910688094]
本研究は, カテゴリーラベルのみを監督として, 正確な対象位置分布マップと対象境界を抽出する, 新たな自己強調手法を提案する。
特に、提案されたセルフエンハンスメントマップは、ILSVRC上で54.88%の最先端のローカライゼーション精度を達成する。
論文 参考訳(メタデータ) (2020-06-09T12:35:55Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z) - Saliency Enhancement using Gradient Domain Edges Merging [65.90255950853674]
本研究では,エッジとサリエンシマップをマージして,サリエンシマップの性能を向上させる手法を開発した。
これにより、DUT-OMRONデータセットの少なくとも3.4倍の平均的な改善により、エッジ(SEE)を使用したサリエンシ向上が提案された。
SEEアルゴリズムは前処理のためのSEE-Preと後処理のためのSEE-Postの2つの部分に分けられる。
論文 参考訳(メタデータ) (2020-02-11T14:04:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。