論文の概要: MobileSal: Extremely Efficient RGB-D Salient Object Detection
- arxiv url: http://arxiv.org/abs/2012.13095v1
- Date: Thu, 24 Dec 2020 04:36:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 08:17:13.503525
- Title: MobileSal: Extremely Efficient RGB-D Salient Object Detection
- Title(参考訳): MobileSal: 極めて効率的なRGB-Dサルエントオブジェクト検出
- Authors: Yu-Huan Wu, Yun Liu, Jun Xu, Jia-Wang Bian, Yuchao Gu, Ming-Ming Cheng
- Abstract要約: 本稿では,効率的なRGB-Dサルエント物体検出(SOD)に焦点を当てた新しいネットワーク,メソッド名を提案する。
RGB-D SODのためのモバイルネットワークの特徴表現能力を強化するために,暗黙的深度復元(IDR)手法を提案する。
IDRとCPRを組み込むことで、7つの挑戦的なRGB-D SODデータセット上のsArtメソッドに対してメソッド名が好ましい。
- 参考スコア(独自算出の注目度): 62.04876251927581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The high computational cost of neural networks has prevented recent successes
in RGB-D salient object detection (SOD) from benefiting real-world
applications. Hence, this paper introduces a novel network, \methodname, which
focuses on efficient RGB-D SOD by using mobile networks for deep feature
extraction. The problem is that mobile networks are less powerful in feature
representation than cumbersome networks. To this end, we observe that the depth
information of color images can strengthen the feature representation related
to SOD if leveraged properly. Therefore, we propose an implicit depth
restoration (IDR) technique to strengthen the feature representation capability
of mobile networks for RGB-D SOD. IDR is only adopted in the training phase and
is omitted during testing, so it is computationally free. Besides, we propose
compact pyramid refinement (CPR) for efficient multi-level feature aggregation
so that we can derive salient objects with clear boundaries. With IDR and CPR
incorporated, \methodname~performs favorably against \sArt methods on seven
challenging RGB-D SOD datasets with much faster speed (450fps) and fewer
parameters (6.5M). The code will be released.
- Abstract(参考訳): ニューラルネットワークの計算コストが高いため、最近のRGB-D salient Object Detection (SOD)の成功は現実のアプリケーションに利益をもたらす。
そこで,本稿では,モバイルネットワークによる深層特徴抽出による効率的なRGB-D SODに着目した新しいネットワーク,‘methodname’を提案する。
問題は、モバイルネットワークが、面倒なネットワークよりも機能表現の力が少ないことだ。
この目的のために,カラー画像の深度情報を適切に活用すれば,SODに関連する特徴表現を強化することができる。
そこで本研究では,RGB-D SODのためのモバイルネットワークの特徴表現能力を強化するために,暗黙の深度復元(IDR)手法を提案する。
IDRはトレーニング段階でのみ採用され、テスト中に省略されるため、計算自由である。
さらに,高効率な多レベル特徴集約のための小型ピラミッド改良(CPR)を提案し,明確な境界を持つ健全な物体を導出する。
idr と cpr を組み込んだ場合、 \methodname~perform は高速 (450fps) でパラメータ (6.5m) の少ない 7 つの挑戦的な rgb-d sod データセットの \sart メソッドに対して好適である。
コードはリリースされます。
関連論文リスト
- SPSN: Superpixel Prototype Sampling Network for RGB-D Salient Object
Detection [5.2134203335146925]
近年,RGB-D Salient Object Detection (SOD) が注目されている。
深層学習手法の進歩にもかかわらず、RGB-D SODは、RGB画像と深度マップと低品質深度マップとの間に大きな領域ギャップがあるため、依然として困難である。
本稿では,この問題を解決するために,新しいスーパーピクセルプロトタイプサンプリングネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-07-16T10:43:14Z) - Pyramidal Attention for Saliency Detection [30.554118525502115]
本稿では,RGB画像のみを活用し,RGBから深度を推定し,中間深度特性を利用する。
ピラミッド型アテンション構造を用いて,マルチレベル畳み込み変換器の特徴を抽出し,初期表現の処理を行う。
我々は8つのRGBおよびRGB-Dデータセット上で21と40の最先端SOD法に対する性能を著しく改善したことを報告した。
論文 参考訳(メタデータ) (2022-04-14T06:57:46Z) - Boosting RGB-D Saliency Detection by Leveraging Unlabeled RGB Images [89.81919625224103]
RGB-D Salient Object Detection (SOD) のための深層モデルの訓練は、しばしば多数のラベル付きRGB-D画像を必要とする。
本稿では、ラベルのないRGB画像を活用するために、Dual-Semi RGB-D Salient Object Detection Network (DS-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-01T03:02:27Z) - Cross-modality Discrepant Interaction Network for RGB-D Salient Object
Detection [78.47767202232298]
本稿では,RGB-D SODのためのクロスモダリティ離散相互作用ネットワーク(CDINet)を提案する。
2つのコンポーネントは、効果的な相互モダリティ相互作用を実装するように設計されている。
我々のネットワークは、定量的にも質的にも15ドルの最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-08-04T11:24:42Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - Accurate RGB-D Salient Object Detection via Collaborative Learning [101.82654054191443]
RGB-Dサリエンシ検出は、いくつかの課題シナリオにおいて素晴らしい能力を示している。
本稿では,エッジ,深度,塩分濃度をより効率的に活用する新しい協調学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T04:33:36Z) - Is Depth Really Necessary for Salient Object Detection? [50.10888549190576]
本稿では,RGB情報のみを推論の入力とする統合深度認識フレームワークの実現に向けた最初の試みを行う。
5つの公開RGB SODベンチマークの最先端のパフォーマンスを上回るだけでなく、5つのベンチマークのRGBDベースのメソッドを大きく上回っている。
論文 参考訳(メタデータ) (2020-05-30T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。