論文の概要: CPDR: Towards Highly-Efficient Salient Object Detection via Crossed Post-decoder Refinement
- arxiv url: http://arxiv.org/abs/2501.06441v1
- Date: Sat, 11 Jan 2025 05:41:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-14 14:24:43.104616
- Title: CPDR: Towards Highly-Efficient Salient Object Detection via Crossed Post-decoder Refinement
- Title(参考訳): CPDR:Crossed Post-Decoder Refinementによる高効率能動物体検出に向けて
- Authors: Yijie Li, Hewei Wang, Aggelos Katsaggelos,
- Abstract要約: 我々は,アテンションダウンサンプルフュージョン (ADF) を導入し,アテンションアテンション・アテンション・アテンション・メカニズムと高レベル表現によるアテンション・マップを用いて低レベル特徴を洗練する。
また,ADFとAUFを併用したDACF(Dual Attention Cross Fusion)を提案し,性能を維持しながらパラメータ数を削減した。
5つのベンチマークデータセットの実験により、我々の手法は従来の最先端手法よりも優れていることが示された。
- 参考スコア(独自算出の注目度): 3.5321836333805425
- License:
- Abstract: Most of the current salient object detection approaches use deeper networks with large backbones to produce more accurate predictions, which results in a significant increase in computational complexity. A great number of network designs follow the pure UNet and Feature Pyramid Network (FPN) architecture which has limited feature extraction and aggregation ability which motivated us to design a lightweight post-decoder refinement module, the crossed post-decoder refinement (CPDR) to enhance the feature representation of a standard FPN or U-Net framework. Specifically, we introduce the Attention Down Sample Fusion (ADF), which employs channel attention mechanisms with attention maps generated by high-level representation to refine the low-level features, and Attention Up Sample Fusion (AUF), leveraging the low-level information to guide the high-level features through spatial attention. Additionally, we proposed the Dual Attention Cross Fusion (DACF) upon ADFs and AUFs, which reduces the number of parameters while maintaining the performance. Experiments on five benchmark datasets demonstrate that our method outperforms previous state-of-the-art approaches.
- Abstract(参考訳): 現在の有能なオブジェクト検出アプローチのほとんどは、より大きなバックボーンを持つより深いネットワークを使用して、より正確な予測を行い、計算の複雑さが大幅に増加する。
多数のネットワーク設計がUNetとFeature Pyramid Network(FPN)アーキテクチャに従っており、これは機能抽出とアグリゲーション能力に制限があり、軽量なポストデコーダリファインメントモジュール、標準FPNまたはU-Netフレームワークの機能表現を強化するためのクロスデコーダリファインダリファインダリファインダリファインダ(CPDR)を設計する動機となった。
具体的には,アテンション・ダウン・サンプル・フュージョン (ADF) を導入し,アテンション・アップ・サンプル・フュージョン (AUF) とアテンション・アップ・サンプル・フュージョン (AUF) を用いて,低レベルの特徴を空間的アテンションを通して誘導する。
さらに,ADF と AUF に対してDACF (Dual Attention Cross Fusion) を提案し,性能を維持しながらパラメータ数を削減した。
5つのベンチマークデータセットの実験により、我々の手法は従来の最先端手法よりも優れていることが示された。
関連論文リスト
- Multi-Scale Direction-Aware Network for Infrared Small Target Detection [2.661766509317245]
赤外小目標検出は、背景とターゲットを効果的に分離することが難しい問題に直面している。
我々は、赤外線小ターゲットの高周波方向特徴を統合するためのマルチスケール方向対応ネットワーク(MSDA-Net)を提案する。
MSDA-Netは、パブリックNUDT-SIRST、SIRST、IRSTD-1kデータセット上で、最先端(SOTA)結果を達成する。
論文 参考訳(メタデータ) (2024-06-04T07:23:09Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Global-Local Path Networks for Monocular Depth Estimation with Vertical
CutDepth [24.897377434844266]
単分子深度推定のための新しい構造とトレーニング戦略を提案する。
階層型トランスフォーマーエンコーダをデプロイして,グローバルなコンテキストをキャプチャし,伝達し,軽量で強力なデコーダを設計する。
我々のネットワークは、挑戦的な深度データセットNYU Depth V2に対して最先端の性能を達成する。
論文 参考訳(メタデータ) (2022-01-19T06:37:21Z) - Densely Nested Top-Down Flows for Salient Object Detection [137.74130900326833]
本稿では,物体検出におけるトップダウンモデリングの役割を再考する。
密度の高いトップダウンフロー(DNTDF)ベースのフレームワークを設計する。
DNTDFのすべての段階において、高いレベルの特徴はプログレッシブ圧縮ショートカットパス(PCSP)を介して読み込まれる。
論文 参考訳(メタデータ) (2021-02-18T03:14:02Z) - EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。
実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文 参考訳(メタデータ) (2020-12-24T04:23:48Z) - Attentional Local Contrast Networks for Infrared Small Target Detection [15.882749652217653]
赤外線小目標検出のための新しいモデル駆動深層ネットワークを提案する。
従来の局所コントラスト測定法を、エンドツーエンドネットワークにおける深さ自在なパラメータレス非線形特徴精製層としてモジュール化します。
ネットワークアーキテクチャの各コンポーネントの有効性と効率を実証的に検証するために,ネットワーク奥行きの異なる詳細なアブレーション研究を行う。
論文 参考訳(メタデータ) (2020-12-15T19:33:09Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。