論文の概要: Data-Level Recombination and Lightweight Fusion Scheme for RGB-D Salient
Object Detection
- arxiv url: http://arxiv.org/abs/2009.05102v1
- Date: Fri, 7 Aug 2020 10:13:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 00:26:35.352840
- Title: Data-Level Recombination and Lightweight Fusion Scheme for RGB-D Salient
Object Detection
- Title(参考訳): RGB-D能動物体検出のためのデータレベル再結合と軽量融合方式
- Authors: Xuehao Wang, Shuai Li, Chenglizhao Chen, Yuming Fang, Aimin Hao, Hong
Qin
- Abstract要約: 深部特徴抽出に先立って,RGBとD(深部)を融合する新たなデータレベル組換え手法を提案する。
新たに設計された3重ストリームネットワークをこれらの新しい定式化データ上に適用し,RGBとDのチャネルワイドな相補的融合状態を実現する。
- 参考スコア(独自算出の注目度): 73.31632581915201
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing RGB-D salient object detection methods treat depth information as an
independent component to complement its RGB part, and widely follow the
bi-stream parallel network architecture. To selectively fuse the CNNs features
extracted from both RGB and depth as a final result, the state-of-the-art
(SOTA) bi-stream networks usually consist of two independent subbranches; i.e.,
one subbranch is used for RGB saliency and the other aims for depth saliency.
However, its depth saliency is persistently inferior to the RGB saliency
because the RGB component is intrinsically more informative than the depth
component. The bi-stream architecture easily biases its subsequent fusion
procedure to the RGB subbranch, leading to a performance bottleneck. In this
paper, we propose a novel data-level recombination strategy to fuse RGB with D
(depth) before deep feature extraction, where we cyclically convert the
original 4-dimensional RGB-D into \textbf{D}GB, R\textbf{D}B and RG\textbf{D}.
Then, a newly lightweight designed triple-stream network is applied over these
novel formulated data to achieve an optimal channel-wise complementary fusion
status between the RGB and D, achieving a new SOTA performance.
- Abstract(参考訳): 既存のRGB-D有向物体検出法は、深度情報を独立成分として扱い、そのRGB部分を補完し、双方向並列ネットワークアーキテクチャを広く採用している。
最終結果としてRGBと深度の両方から抽出されたCNNの特徴を選択的に融合させるため、最先端(SOTA)のバイストリームネットワークは通常、2つの独立したサブブランチから構成される。
しかし,rgb成分は深部成分よりも本質的に有益であるため,深部塩分はrgb塩分よりも持続的に劣っている。
バイストリームアーキテクチャは、その後の融合手順をRGBサブブランチに容易にバイアスし、パフォーマンスボトルネックを引き起こす。
本稿では,rgbとd (deep) を融合する新しいデータレベル組換え戦略を提案する。ここでは,元の4次元 rgb-d を循環的に \textbf{d}gb, r\textbf{d}b, rg\textbf{d} に変換する。
そして、これらの新しい定式化データに対して、新たに設計された3重ストリームネットワークを適用して、RGBとDのチャネル的に最適な相補的な融合状態を実現し、新たなSOTA性能を実現する。
関連論文リスト
- Pyramidal Attention for Saliency Detection [30.554118525502115]
本稿では,RGB画像のみを活用し,RGBから深度を推定し,中間深度特性を利用する。
ピラミッド型アテンション構造を用いて,マルチレベル畳み込み変換器の特徴を抽出し,初期表現の処理を行う。
我々は8つのRGBおよびRGB-Dデータセット上で21と40の最先端SOD法に対する性能を著しく改善したことを報告した。
論文 参考訳(メタデータ) (2022-04-14T06:57:46Z) - Boosting RGB-D Saliency Detection by Leveraging Unlabeled RGB Images [89.81919625224103]
RGB-D Salient Object Detection (SOD) のための深層モデルの訓練は、しばしば多数のラベル付きRGB-D画像を必要とする。
本稿では、ラベルのないRGB画像を活用するために、Dual-Semi RGB-D Salient Object Detection Network (DS-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-01T03:02:27Z) - Cross-modality Discrepant Interaction Network for RGB-D Salient Object
Detection [78.47767202232298]
本稿では,RGB-D SODのためのクロスモダリティ離散相互作用ネットワーク(CDINet)を提案する。
2つのコンポーネントは、効果的な相互モダリティ相互作用を実装するように設計されている。
我々のネットワークは、定量的にも質的にも15ドルの最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-08-04T11:24:42Z) - Bi-directional Cross-Modality Feature Propagation with
Separation-and-Aggregation Gate for RGB-D Semantic Segmentation [59.94819184452694]
深度情報はRGBD画像のセマンティックセグメンテーションにおいて有用であることが証明されている。
既存のほとんどの研究は、深度測定がRGBピクセルと正確で整合していると仮定し、問題をモーダルな特徴融合としてモデル化している。
本稿では,RGB特徴量応答を効果的に再検討するだけでなく,複数の段階を通して正確な深度情報を抽出し,代わりに2つの補正表現を集約する,統一的で効率的なクロスモダリティガイドを提案する。
論文 参考訳(メタデータ) (2020-07-17T18:35:24Z) - Cross-Modal Weighting Network for RGB-D Salient Object Detection [76.0965123893641]
我々は,RGB-D SODの深度チャネルとRGB-D SODの包括的相互作用を促進するために,新しいクロスモーダルウェイトリング(CMW)戦略を提案する。
具体的には、CMW-L、CMW-M、CMW-Hという3つのRGB-depth相互作用モジュールが、それぞれ低レベル、中級、高レベルのクロスモーダル情報融合を扱うように開発されている。
CMWNetは、7つの人気のあるベンチマークで15の最先端のRGB-D SODメソッドを上回っている。
論文 参考訳(メタデータ) (2020-07-09T16:01:44Z) - Synergistic saliency and depth prediction for RGB-D saliency detection [76.27406945671379]
既存のRGB-Dサリエンシデータセットは小さく、多様なシナリオに対して過度に適合し、限定的な一般化につながる可能性がある。
そこで本研究では,RGB-Dサリエンシ検出のための半教師付きシステムを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:24:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。