論文の概要: All in One: RGB, RGB-D, and RGB-T Salient Object Detection
- arxiv url: http://arxiv.org/abs/2311.14746v1
- Date: Thu, 23 Nov 2023 03:34:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-30 09:49:16.361702
- Title: All in One: RGB, RGB-D, and RGB-T Salient Object Detection
- Title(参考訳): まとめ:RGB、RGB-D、RGB-T Salient Object Detection
- Authors: Xingzhao Jia, Zhongqiu Zhao, Changlei Dongye, and Zhao Zhang
- Abstract要約: オブジェクト指向物体検出(SOD)は、画像内の最も魅力的な物体を特定することを目的としている。
従来の研究では、個々のデータ型による唾液度検出に焦点が当てられていた。
本稿では,3種類のデータに対する健全なオブジェクト検出タスクに統一されたソリューションを提供する,革新的なモデルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.417439550842723
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Salient object detection (SOD) aims to identify the most attractive objects
within an image. Depending on the type of data being detected, SOD can be
categorized into various forms, including RGB, RGB-D (Depth), RGB-T (Thermal)
and light field SOD. Previous researches have focused on saliency detection
with individual data type. If the RGB-D SOD model is forced to detect RGB-T
data it will perform poorly. We propose an innovative model framework that
provides a unified solution for the salient object detection task of three
types of data (RGB, RGB-D, and RGB-T). The three types of data can be handled
in one model (all in one) with the same weight parameters. In this framework,
the three types of data are concatenated in an ordered manner within a single
input batch, and features are extracted using a transformer network. Based on
this framework, we propose an efficient lightweight SOD model, namely AiOSOD,
which can detect any RGB, RGB-D, and RGB-T data with high speed (780FPS for RGB
data, 485FPS for RGB-D or RGB-T data). Notably, with only 6.25M parameters,
AiOSOD achieves excellent performance on RGB, RGB-D, and RGB-T datasets.
- Abstract(参考訳): 正当性物体検出(SOD)は、画像内の最も魅力的な物体を特定することを目的としている。
検出されるデータの種類によって、SODはRGB、RGB-D(Depth)、RGB-T(Thermal)、光電場SODなど様々な形態に分類できる。
これまでの研究は、個々のデータ型による塩分検出に重点を置いてきた。
RGB-D SODモデルがRGB-Tデータを検出せざるを得ない場合、性能は低下する。
3種類のデータ(rgb, rgb-d, rgb-t)のサルエントオブジェクト検出タスクに対して, 統一解を提供する革新的なモデルフレームワークを提案する。
3種類のデータは、同じ重みパラメータを持つ1つのモデル(すべて1つ)で処理できる。
本フレームワークでは,3種類のデータを単一入力バッチ内で順序的に結合し,トランスフォーマネットワークを用いて特徴を抽出する。
本研究では, 高速でRGB, RGB-D, RGB-Tデータ(RGBデータ780FPS, RGB-D, RGB-Tデータ485FPS)を検出可能な,効率的な軽量SODモデルを提案する。
625万のパラメータだけで、AiOSODはRGB、RGB-D、RGB-Tデータセット上で優れたパフォーマンスを達成する。
関連論文リスト
- RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker [4.235252053339947]
本稿では,新しいRGB-Sonar(RGB-S)トラッキングタスクを提案する。
RGBとソナーモダリティの相互作用により、水中の標的の効率的な追跡を実現する方法について検討する。
論文 参考訳(メタデータ) (2024-06-11T12:01:11Z) - DFormer: Rethinking RGBD Representation Learning for Semantic
Segmentation [76.81628995237058]
DFormerは、RGB-Dセグメンテーションタスクの転送可能な表現を学ぶための新しいフレームワークである。
ImageNet-1Kから画像深度ペアを使用してバックボーンを事前トレーニングする。
DFormerは2つのRGB-Dタスクで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-09-18T11:09:11Z) - RGBD1K: A Large-scale Dataset and Benchmark for RGB-D Object Tracking [30.448658049744775]
注釈付きRGB-D追跡データが限られているため、最先端のRGB-Dトラッカーのほとんどは、高性能なRGB-Dトラッカーの単純な拡張である。
データセット不足問題に対処するため,RGBD1Kという新しいRGB-Dデータセットを報告した。
論文 参考訳(メタデータ) (2022-08-21T03:07:36Z) - Boosting RGB-D Saliency Detection by Leveraging Unlabeled RGB Images [89.81919625224103]
RGB-D Salient Object Detection (SOD) のための深層モデルの訓練は、しばしば多数のラベル付きRGB-D画像を必要とする。
本稿では、ラベルのないRGB画像を活用するために、Dual-Semi RGB-D Salient Object Detection Network (DS-Net)を提案する。
論文 参考訳(メタデータ) (2022-01-01T03:02:27Z) - DUT-LFSaliency: Versatile Dataset and Light Field-to-RGB Saliency
Detection [104.50425501764806]
ライトフィールドサリエンシー検出のための汎用性の高いアプリケーションを可能にする大規模なデータセットを紹介します。
本論文では,フォカルストリームとRGBストリームからなる非対称2ストリームモデルを提案する。
実験は、我々の焦点ストリームが最先端のパフォーマンスを達成することを実証する。
論文 参考訳(メタデータ) (2020-12-30T11:53:27Z) - Data-Level Recombination and Lightweight Fusion Scheme for RGB-D Salient
Object Detection [73.31632581915201]
深部特徴抽出に先立って,RGBとD(深部)を融合する新たなデータレベル組換え手法を提案する。
新たに設計された3重ストリームネットワークをこれらの新しい定式化データ上に適用し,RGBとDのチャネルワイドな相補的融合状態を実現する。
論文 参考訳(メタデータ) (2020-08-07T10:13:05Z) - Synergistic saliency and depth prediction for RGB-D saliency detection [76.27406945671379]
既存のRGB-Dサリエンシデータセットは小さく、多様なシナリオに対して過度に適合し、限定的な一般化につながる可能性がある。
そこで本研究では,RGB-Dサリエンシ検出のための半教師付きシステムを提案する。
論文 参考訳(メタデータ) (2020-07-03T14:24:41Z) - Is Depth Really Necessary for Salient Object Detection? [50.10888549190576]
本稿では,RGB情報のみを推論の入力とする統合深度認識フレームワークの実現に向けた最初の試みを行う。
5つの公開RGB SODベンチマークの最先端のパフォーマンスを上回るだけでなく、5つのベンチマークのRGBDベースのメソッドを大きく上回っている。
論文 参考訳(メタデータ) (2020-05-30T13:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。