論文の概要: Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection
- arxiv url: http://arxiv.org/abs/2008.07064v1
- Date: Mon, 17 Aug 2020 02:55:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 03:52:28.873052
- Title: Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection
- Title(参考訳): rgb-dサルエント物体検出のための漸進的改良ネットワーク
- Authors: Shuhan Chen, Yun Fu
- Abstract要約: 我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
- 参考スコア(独自算出の注目度): 63.18846475183332
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we aim to develop an efficient and compact deep network for
RGB-D salient object detection, where the depth image provides complementary
information to boost performance in complex scenarios. Starting from a coarse
initial prediction by a multi-scale residual block, we propose a progressively
guided alternate refinement network to refine it. Instead of using ImageNet
pre-trained backbone network, we first construct a lightweight depth stream by
learning from scratch, which can extract complementary features more
efficiently with less redundancy. Then, different from the existing fusion
based methods, RGB and depth features are fed into proposed guided residual
(GR) blocks alternately to reduce their mutual degradation. By assigning
progressive guidance in the stacked GR blocks within each side-output, the
false detection and missing parts can be well remedied. Extensive experiments
on seven benchmark datasets demonstrate that our model outperforms existing
state-of-the-art approaches by a large margin, and also shows superiority in
efficiency (71 FPS) and model size (64.9 MB).
- Abstract(参考訳): 本稿では,複雑なシナリオにおける性能向上のために,深度画像が補完情報を提供するRGB-D有向物体検出のための,効率的でコンパクトなディープネットワークを開発することを目的とする。
マルチスケール残差ブロックによる粗い初期予測からスタートし、それを改良するための段階的にガイドされた代替精錬網を提案する。
imagenetプリトレーニングされたバックボーンネットワークを使う代わりに、私たちはまずスクラッチから学習することで軽量な深度ストリームを構築します。
そして, 既存の核融合法と異なり, RGB と深さ特性は相互劣化を低減するために, それぞれ交互に誘導残差 (GR) ブロックに供給される。
各サイドアウトプット内の積み重ねられたgrブロックにプログレッシブガイダンスを割り当てることで、誤った検出と欠落部分の解消が図れる。
7つのベンチマークデータセットに対する大規模な実験により、我々のモデルは既存の最先端アプローチよりも大きなマージンで優れており、効率(71 FPS)とモデルサイズ(64.9 MB)が優れていることが示された。
関連論文リスト
- RGB-based Category-level Object Pose Estimation via Decoupled Metric
Scale Recovery [72.13154206106259]
本研究では、6次元のポーズとサイズ推定を分離し、不完全なスケールが剛性変換に与える影響を緩和するパイプラインを提案する。
具体的には,事前学習した単分子推定器を用いて局所的な幾何学的情報を抽出する。
別個のブランチは、カテゴリレベルの統計に基づいてオブジェクトのメートル法スケールを直接復元するように設計されている。
論文 参考訳(メタデータ) (2023-09-19T02:20:26Z) - AGG-Net: Attention Guided Gated-convolutional Network for Depth Image
Completion [1.8820731605557168]
注意誘導ゲート畳み込みネットワーク(AGG-Net)に基づく深度画像補完のための新しいモデルを提案する。
符号化段階では、異なるスケールでの深度と色の特徴の融合を実現するために、AG-GConvモジュールが提案されている。
復号段階では、アテンションガイドスキップ接続(AG-SC)モジュールが提示され、再構成にあまりにも多くの深度に関係のない特徴を導入することを避ける。
論文 参考訳(メタデータ) (2023-09-04T14:16:08Z) - Symmetric Uncertainty-Aware Feature Transmission for Depth
Super-Resolution [52.582632746409665]
カラー誘導DSRのためのSymmetric Uncertainty-aware Feature Transmission (SUFT)を提案する。
本手法は最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T06:35:59Z) - Pyramidal Attention for Saliency Detection [30.554118525502115]
本稿では,RGB画像のみを活用し,RGBから深度を推定し,中間深度特性を利用する。
ピラミッド型アテンション構造を用いて,マルチレベル畳み込み変換器の特徴を抽出し,初期表現の処理を行う。
我々は8つのRGBおよびRGB-Dデータセット上で21と40の最先端SOD法に対する性能を著しく改善したことを報告した。
論文 参考訳(メタデータ) (2022-04-14T06:57:46Z) - Deep Amended Gradient Descent for Efficient Spectral Reconstruction from
Single RGB Images [42.26124628784883]
本稿では、AGD-Netという、コンパクトで効率的でエンドツーエンドの学習ベースのフレームワークを提案する。
まず、古典的勾配降下アルゴリズムに基づいて問題を明示的に定式化する。
AGD-Netは、平均1.0dB以上のリコンストラクション品質を向上させることができる。
論文 参考訳(メタデータ) (2021-08-12T05:54:09Z) - Self-Supervised Representation Learning for RGB-D Salient Object
Detection [93.17479956795862]
我々は、自己教師付き表現学習を用いて、クロスモーダルオートエンコーダと深さ-輪郭推定という2つのプレテキストタスクを設計する。
我々のプレテキストタスクは、ネットワークがリッチなセマンティックコンテキストをキャプチャする事前トレーニングを実行するのに、少数のRGB-Dデータセットしか必要としない。
RGB-D SODにおけるクロスモーダル核融合の固有の問題として,マルチパス核融合モジュールを提案する。
論文 参考訳(メタデータ) (2021-01-29T09:16:06Z) - MobileSal: Extremely Efficient RGB-D Salient Object Detection [62.04876251927581]
本稿では,効率的なRGB-Dサルエント物体検出(SOD)に焦点を当てた新しいネットワーク,メソッド名を提案する。
RGB-D SODのためのモバイルネットワークの特徴表現能力を強化するために,暗黙的深度復元(IDR)手法を提案する。
IDRとCPRを組み込むことで、7つの挑戦的なRGB-D SODデータセット上のsArtメソッドに対してメソッド名が好ましい。
論文 参考訳(メタデータ) (2020-12-24T04:36:42Z) - A Single Stream Network for Robust and Real-time RGB-D Salient Object
Detection [89.88222217065858]
我々は、深度マップを用いて、RGBと深度の間の早期融合と中核融合を誘導する単一ストリームネットワークを設計する。
このモデルは、現在の最も軽量なモデルよりも55.5%軽く、32 FPSのリアルタイム速度で384倍の384ドルの画像を処理している。
論文 参考訳(メタデータ) (2020-07-14T04:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。