論文の概要: Densely Nested Top-Down Flows for Salient Object Detection
- arxiv url: http://arxiv.org/abs/2102.09133v1
- Date: Thu, 18 Feb 2021 03:14:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-19 14:20:55.180818
- Title: Densely Nested Top-Down Flows for Salient Object Detection
- Title(参考訳): サリエント物体検出のための密度ネストトップダウンフロー
- Authors: Chaowei Fang, Haibin Tian, Dingwen Zhang, Qiang Zhang, Jungong Han,
Junwei Han
- Abstract要約: 本稿では,物体検出におけるトップダウンモデリングの役割を再考する。
密度の高いトップダウンフロー(DNTDF)ベースのフレームワークを設計する。
DNTDFのすべての段階において、高いレベルの特徴はプログレッシブ圧縮ショートカットパス(PCSP)を介して読み込まれる。
- 参考スコア(独自算出の注目度): 137.74130900326833
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the goal of identifying pixel-wise salient object regions from each
input image, salient object detection (SOD) has been receiving great attention
in recent years. One kind of mainstream SOD methods is formed by a bottom-up
feature encoding procedure and a top-down information decoding procedure. While
numerous approaches have explored the bottom-up feature extraction for this
task, the design on top-down flows still remains under-studied. To this end,
this paper revisits the role of top-down modeling in salient object detection
and designs a novel densely nested top-down flows (DNTDF)-based framework. In
every stage of DNTDF, features from higher levels are read in via the
progressive compression shortcut paths (PCSP). The notable characteristics of
our proposed method are as follows. 1) The propagation of high-level features
which usually have relatively strong semantic information is enhanced in the
decoding procedure; 2) With the help of PCSP, the gradient vanishing issues
caused by non-linear operations in top-down information flows can be
alleviated; 3) Thanks to the full exploration of high-level features, the
decoding process of our method is relatively memory efficient compared against
those of existing methods. Integrating DNTDF with EfficientNet, we construct a
highly light-weighted SOD model, with very low computational complexity. To
demonstrate the effectiveness of the proposed model, comprehensive experiments
are conducted on six widely-used benchmark datasets. The comparisons to the
most state-of-the-art methods as well as the carefully-designed baseline models
verify our insights on the top-down flow modeling for SOD. The code of this
paper is available at https://github.com/new-stone-object/DNTD.
- Abstract(参考訳): 近年,各入力画像から画素単位の正当性物体領域を特定することを目的として,正当性物体検出(SOD)が注目されている。
主流sod手法の一つはボトムアップ特徴符号化手順とトップダウン情報復号手順によって形成される。
多くのアプローチがこのタスクのボトムアップ機能抽出を検討しているが、トップダウンフローの設計はまだ検討されていない。
そこで本稿では,高次物体検出におけるトップダウンモデリングの役割を再考し,高密度ネストトダウンフロー(DNTDF)に基づく新しいフレームワークを設計する。
DNTDFのすべての段階において、高いレベルの特徴はプログレッシブ圧縮ショートカットパス(PCSP)を介して読み込まれる。
提案手法の特徴は以下のとおりである。
1) 比較的強い意味情報を持つ高レベルの特徴の伝播は, 復号処理において強化され, 2) PCSPの助けを借りて, トップダウン情報フローにおける非線形操作によって生じる問題を解消し, 3) 高レベルの特徴の完全な探索により, 提案手法の復号処理は, 既存の手法と比較して比較的メモリ効率が良い。
DNTDFとEfficientNetを統合することで,計算量が非常に少ない軽量SODモデルを構築する。
提案手法の有効性を示すために,6つのベンチマークデータセットを用いた総合実験を行った。
最先端の手法と慎重に設計されたベースラインモデルの比較は、SODのトップダウンフローモデリングに関する当社の洞察を検証します。
この論文のコードはhttps://github.com/new-stone-object/DNTDで入手できる。
関連論文リスト
- PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。
HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。
すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文 参考訳(メタデータ) (2024-08-02T09:31:21Z) - Out-of-distribution detection based on subspace projection of high-dimensional features output by the last convolutional layer [5.902332693463877]
本稿では,リッチな画像特徴を含む最終畳み込み層によって出力される高次元特徴に焦点をあてる。
我々のキーとなるアイデアは、これらの高次元特徴を2つの特定の特徴部分空間に投影し、事前定義された均一分布クラス Centroids (PEDCC)-Loss で訓練することです。
本手法では,入力前処理や特定のOODデータの事前チューニングの必要性を排除し,分類ネットワークモデルのトレーニングのみを必要とする。
論文 参考訳(メタデータ) (2024-05-02T18:33:02Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - LocATe: End-to-end Localization of Actions in 3D with Transformers [91.28982770522329]
LocATeは、3Dシーケンスでアクションを共同でローカライズし認識するエンドツーエンドのアプローチである。
画像やパッチの特徴を入力として考えるトランスフォーマーベースのオブジェクト検出や分類モデルとは異なり、LocATeのトランスフォーマーモデルはシーケンス内のアクション間の長期的な相関をキャプチャすることができる。
BABEL-TAL-20 (BT20) という新しい,挑戦的で,より現実的なベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2022-03-21T03:35:32Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Occlusion-Robust Object Pose Estimation with Holistic Representation [42.27081423489484]
State-of-the-art(SOTA)オブジェクトのポーズ推定器は2段階のアプローチを取る。
我々は,新しいブロック・アンド・ブラックアウトバッチ拡張技術を開発した。
また,総合的なポーズ表現学習を促進するためのマルチ精度監視アーキテクチャも開発している。
論文 参考訳(メタデータ) (2021-10-22T08:00:26Z) - BiconNet: An Edge-preserved Connectivity-based Approach for Salient
Object Detection [3.3517146652431378]
既存のSaliencyベースのSODフレームワークをバックボーンとして使用できることを示す。
5つのベンチマークデータセットの総合的な実験を通して,提案手法が最先端のSOD手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-02-27T21:39:04Z) - EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。
実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文 参考訳(メタデータ) (2020-12-24T04:23:48Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。