論文の概要: DFNet: Discriminative feature extraction and integration network for
salient object detection
- arxiv url: http://arxiv.org/abs/2004.01573v1
- Date: Fri, 3 Apr 2020 13:56:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-17 04:46:48.283819
- Title: DFNet: Discriminative feature extraction and integration network for
salient object detection
- Title(参考訳): dfnet:salient object detectionのための識別的特徴抽出および統合ネットワーク
- Authors: Mehrdad Noori, Sina Mohammadi, Sina Ghofrani Majelan, Ali Bahri,
Mohammad Havaei
- Abstract要約: 畳み込みニューラルネットワークを用いた唾液度検出における課題の2つの側面に焦点をあてる。
第一に、様々な大きさに有能な物体が現れるため、単一スケールの畳み込みは適切な大きさを捉えない。
第二に、マルチレベル機能の使用は、モデルがローカルコンテキストとグローバルコンテキストの両方を使用するのに役立つ。
- 参考スコア(独自算出の注目度): 6.959742268104327
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the powerful feature extraction capability of Convolutional Neural
Networks, there are still some challenges in saliency detection. In this paper,
we focus on two aspects of challenges: i) Since salient objects appear in
various sizes, using single-scale convolution would not capture the right size.
Moreover, using multi-scale convolutions without considering their importance
may confuse the model. ii) Employing multi-level features helps the model use
both local and global context. However, treating all features equally results
in information redundancy. Therefore, there needs to be a mechanism to
intelligently select which features in different levels are useful. To address
the first challenge, we propose a Multi-scale Attention Guided Module. This
module not only extracts multi-scale features effectively but also gives more
attention to more discriminative feature maps corresponding to the scale of the
salient object. To address the second challenge, we propose an Attention-based
Multi-level Integrator Module to give the model the ability to assign different
weights to multi-level feature maps. Furthermore, our Sharpening Loss function
guides our network to output saliency maps with higher certainty and less
blurry salient objects, and it has far better performance than the
Cross-entropy loss. For the first time, we adopt four different backbones to
show the generalization of our method. Experiments on five challenging datasets
prove that our method achieves the state-of-the-art performance. Our approach
is fast as well and can run at a real-time speed.
- Abstract(参考訳): 畳み込みニューラルネットワークの強力な特徴抽出能力にもかかわらず、塩分検出にはいくつかの課題がある。
本稿では,課題の2つの側面に焦点を当てる。
i) サリエントオブジェクトは様々なサイズで現れるため、単一スケールの畳み込みを用いると適切な大きさをキャプチャできない。
さらに、その重要性を考慮せずにマルチスケール畳み込みを使用すると、モデルが混乱する可能性がある。
ii) マルチレベル機能の採用は、モデルがローカルとグローバルの両方のコンテキストを使用するのに役立つ。
しかし、全ての特徴を平等に扱うと、情報冗長性が生じる。
したがって、異なるレベルのどの機能が有用なのかをインテリジェントに選択するメカニズムが必要である。
最初の課題を解決するために,マルチスケール注意誘導モジュールを提案する。
このモジュールは、マルチスケールな特徴を効果的に抽出するだけでなく、サルエントオブジェクトのスケールに対応するより識別的な特徴マップにより多くの注意を向ける。
第2の課題に対処するために,注意に基づくマルチレベルインテグレータモジュールを提案する。
さらに, シャープニング損失関数は, より確実性が高く, ぼやけたサルエント対象の少ないサニエントマップを出力するようにネットワークを誘導し, クロスエントロピー損失よりも優れた性能を示す。
提案手法の一般化を示すために,初めて4つの異なるバックボーンを採用する。
5つの挑戦的データセットの実験により,本手法が最先端の性能を達成することを示す。
私たちのアプローチも高速で、リアルタイムの速度で実行可能です。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - FeatUp: A Model-Agnostic Framework for Features at Any Resolution [24.4201195336725]
FeatUpは、失われた空間情報を深い特徴で復元するためのタスクおよびモデルに依存しないフレームワークである。
FeatUpの2つのバリエーションを紹介します。1つは、1つのフォワードパスで高分解能信号で特徴を導くもので、もう1つは暗黙のモデルを1つのイメージに適合させて、任意の解像度で特徴を再構成するものです。
FeatUpは、クラスアクティベーションマップ生成、セグメンテーションとデプス予測のためのトランスファーラーニング、セグメンテーションのためのエンドツーエンドトレーニングにおいて、他の機能アップサンプリングや画像超解像アプローチよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2024-03-15T17:57:06Z) - M$^3$Net: Multilevel, Mixed and Multistage Attention Network for Salient
Object Detection [22.60675416709486]
M$3$Netは、Salient Object Detectionのためのアテンションネットワークである。
マルチレベル特徴間の相互作用を実現するためのクロスアテンションアプローチ。
Mixed Attention Blockは、グローバルレベルとローカルレベルの両方でコンテキストをモデリングすることを目的としている。
集約された特徴をステージごとに最適化するためのマルチレベル監視戦略。
論文 参考訳(メタデータ) (2023-09-15T12:46:14Z) - HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness [2.341385717236931]
本稿では,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。
我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。
当社のHiDAnetは最先端の手法よりも大きなマージンで良好に動作します。
論文 参考訳(メタデータ) (2023-01-18T10:00:59Z) - Correlation-Aware Deep Tracking [83.51092789908677]
本稿では,自己/横断的意図に着想を得た,新たなターゲット依存型特徴ネットワークを提案する。
我々のネットワークは機能ネットワークの複数の層にクロスイメージの特徴相関を深く埋め込んでいる。
我々のモデルは、豊富な未ペア画像に対して柔軟に事前訓練が可能であり、既存の手法よりも顕著に高速な収束をもたらす。
論文 参考訳(メタデータ) (2022-03-03T11:53:54Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Efficient and Accurate Multi-scale Topological Network for Single Image
Dehazing [31.543771270803056]
本稿では,入力画像自体の特徴抽出と利用に注意を払います。
本稿では,マルチスケールトポロジカルネットワーク (mstn) を提案する。
一方、我々は、異なるスケールで機能の選択と融合を達成するために、マルチスケール機能融合モジュール(MFFM)と適応機能選択モジュール(AFSM)を設計します。
論文 参考訳(メタデータ) (2021-02-24T08:53:14Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。