論文の概要: LC3Net: Ladder context correlation complementary network for salient
object detection
- arxiv url: http://arxiv.org/abs/2110.10869v1
- Date: Thu, 21 Oct 2021 03:12:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-22 17:14:44.348404
- Title: LC3Net: Ladder context correlation complementary network for salient
object detection
- Title(参考訳): LC3Net:有意物体検出のためのラダーコンテキスト相関補完ネットワーク
- Authors: Xian Fang and Jinchao Zhu and Xiuli Shao and Hongpeng Wang
- Abstract要約: 我々は,新しいラグコンテキスト相関補完ネットワーク (LC3Net) を提案する。
FCBはフィルタリング可能な畳み込みブロックであり、初期特徴の多様性に関する情報の自動収集を支援する。
DCMは、異なるレベルの特徴の密集を促進するための密接なクロスモジュールである。
BCDは双方向圧縮デコーダであり、マルチスケール機能の段階的縮小を支援する。
- 参考スコア(独自算出の注目度): 0.32116198597240836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently, existing salient object detection methods based on convolutional
neural networks commonly resort to constructing discriminative networks to
aggregate high level and low level features. However, contextual information is
always not fully and reasonably utilized, which usually causes either the
absence of useful features or contamination of redundant features. To address
these issues, we propose a novel ladder context correlation complementary
network (LC3Net) in this paper, which is equipped with three crucial
components. At the beginning, we propose a filterable convolution block (FCB)
to assist the automatic collection of information on the diversity of initial
features, and it is simple yet practical. Besides, we propose a dense cross
module (DCM) to facilitate the intimate aggregation of different levels of
features by validly integrating semantic information and detailed information
of both adjacent and non-adjacent layers. Furthermore, we propose a
bidirectional compression decoder (BCD) to help the progressive shrinkage of
multi-scale features from coarse to fine by leveraging multiple pairs of
alternating top-down and bottom-up feature interaction flows. Extensive
experiments demonstrate the superiority of our method against 16
state-of-the-art methods.
- Abstract(参考訳): 現在,畳み込みニューラルネットワークに基づく有能な物体検出手法では,高次・低次特徴を集約する識別ネットワークの構築が一般的である。
しかし、コンテキスト情報は必ずしも完全かつ合理的に利用されないため、通常、有用な特徴の欠如や冗長な特徴の汚染を引き起こす。
これらの課題に対処するために,3つの重要なコンポーネントを備えた新しいラダーコンテキスト相関補完ネットワーク (LC3Net) を提案する。
まず,初期特徴の多様性に関する情報の自動収集を支援するため,フィルタ可能な畳み込みブロック(FCB)を提案する。
さらに,隣接層と非隣接層の両方のセマンティック情報と詳細情報を有効に統合することにより,特徴量の密集化を容易にする密接なクロスモジュール(DCM)を提案する。
さらに,複数対の交代型トップダウンおよびボトムアップ機能間相互作用フローを活用することで,マルチスケール特徴の粗大化から微細化の進行的縮小を支援する双方向圧縮デコーダ(BCD)を提案する。
大規模実験により16種類の最先端手法に対する本手法の優位性を実証した。
関連論文リスト
- PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - A Semantic-Aware and Multi-Guided Network for Infrared-Visible Image Fusion [41.34335755315773]
マルチモダリティ画像融合は、2つのソース画像から特定のモダリティ情報と共有モダリティ情報を融合することを目的としている。
本稿では,3分岐エンコーダデコーダアーキテクチャと,それに対応する融合層を融合戦略として提案する。
可視・近赤外画像融合および医用画像融合タスクにおける最先端手法と比較して,本手法は競争力のある結果を得た。
論文 参考訳(メタデータ) (2024-06-11T09:32:40Z) - TC-Net: Triple Context Network for Automated Stroke Lesion Segmentation [0.5482532589225552]
本稿では,空間的コンテキスト情報を中心として,新たなネットワークである Triple Context Network (TC-Net) を提案する。
我々のネットワークはオープンデータセットATLASで評価され、最高スコアは0.594、ハウスドルフ距離は27.005mm、平均対称性表面距離は7.137mmである。
論文 参考訳(メタデータ) (2022-02-28T11:12:16Z) - DFC: Deep Feature Consistency for Robust Point Cloud Registration [0.4724825031148411]
複雑なアライメントシーンのための学習に基づくアライメントネットワークを提案する。
我々は,3DMatchデータセットとKITTIオドメトリデータセットに対するアプローチを検証する。
論文 参考訳(メタデータ) (2021-11-15T08:27:21Z) - Specificity-preserving RGB-D Saliency Detection [103.3722116992476]
本稿では,RGB-Dサリエンシ検出のための特異性保存ネットワーク(SP-Net)を提案する。
2つのモダリティ特化ネットワークと共有学習ネットワークを採用し、個別および共有唾液マップを生成する。
6つのベンチマークデータセットの実験では、SP-Netは他の最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2021-08-18T14:14:22Z) - Modal-Adaptive Gated Recoding Network for RGB-D Salient Object Detection [2.9153096940947796]
本稿では,2つのモードの情報の有効性を評価するために,GRNet(GRNet)を提案する。
知覚エンコーダを用いてマルチレベル単一モード特徴を抽出する。
無効な情報を抑制し、有効なモーダル特徴を復号ミキサとハイブリッド分岐復号器に転送するために、モーダル適応ゲートユニットを提案する。
論文 参考訳(メタデータ) (2021-08-13T15:08:21Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Hierarchical Bi-Directional Feature Perception Network for Person
Re-Identification [12.259747100939078]
過去の人物再同定(Re-ID)モデルは、画像の最も識別性の高い領域に焦点を当てることを目的としている。
本稿では,階層型双方向特徴知覚ネットワーク (HBFP-Net) という新しいモデルを提案する。
Market-1501, CUHK03, DukeMTMC-ReIDデータセットなどの主要な評価実験により, 提案手法が最近のSOTA Re-IDモデルより優れていることが示された。
論文 参考訳(メタデータ) (2020-08-08T12:33:32Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z) - Cross-layer Feature Pyramid Network for Salient Object Detection [102.20031050972429]
本稿では,有能な物体検出における進行的融合を改善するために,新しいクロス層特徴ピラミッドネットワークを提案する。
レイヤごとの分散機能は、他のすべてのレイヤからセマンティクスと健全な詳細の両方を同時に所有し、重要な情報の損失を減らします。
論文 参考訳(メタデータ) (2020-02-25T14:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。